關於namenode、datanode和secondarynamenode的互動過程

阿新 • • 發佈：2018-12-09

元資料是儲存在namenode中的，這些元資料包括檔名、目錄名，檔案目錄從屬關係、檔案大小，檔案與塊對應關係，塊所對應的節點等；namenode會將這些元資料資訊儲存在硬碟上，對應的名字是fsimage_txid（即類似這種：fsimage_000000000000003210），以備下次啟動時，可以及時獲取到整個hdfs檔案系統的重要資訊;除了這個檔案，還有一個檔案edits（或者叫editlog，對應的名字格式：edit_0000000000000xxxx-000000000000xxx+1,~~由於此檔案儲存hdfs的所有動作，儲存資料量較大，因此~~通常會分成多個檔案儲存）檔案，這個檔案記錄了namenode(以及客戶端)和datanode互動的所有動作，如果說fsimage檔案是地理緯度，則edits檔案是時間維度，也就是說，fsimage檔案+edits檔案=hdfs在某一時刻的快照。

當hdfs重新啟動時，必須獲得hdfs關閉前的狀態，而這個狀態自然是記錄在fsimage和edits檔案中的，因此需要將fsimage和edits中儲存的資訊載入入namenode的記憶體，其方式是先將fsimage載入，然後逐條執行edits中的指令，這樣看好像解決了重啟丟失資料的問題，但仍然有其它問題，hdfs叢集通常是長期不關機的，這回造成edits檔案無限變大，如果經過了很長時間後，需要重啟一次，再像之前那樣載入fsimage特別是edits檔案，會出現啟動時間過長的問題.....三五個小時，甚至整天的時間......

解決這個問題的關鍵在於怎樣在不停止hdfs服務的情況下縮小edits檔案，且又要保證資料完整性！目前，hadoop是使用secondarynamenode來解決這個問題的，見下圖（不好意思，摘自網上，自己畫圖水平實在太爛....）：

在上圖中，首先，namenode將自己的edits檔案重新命名為edits-new；然後在滿足一些條件的情況下（這些條件包括：時間“預設一個小時，由hdfs-default.xml中的dfs.namenode.checkpoint.preiod引數指定”；次數“預設一百萬次，有hdfs-default.xml的dfs.namenode.checkpoint.txns引數指定”）secondarynamenode通過HTTP的GET請求方式去獲取namenode上的fsimage和edits檔案；第三，在secondarynamenode中將edits和fsimage進行合併（合併過程：snd載入fsimage，執行edits中的操作，然後重新生成一個新的fsimage，並重命名為fsimage_ckpd_txid）；第四，通過HTTP的POST方式將合併後的fsimage上傳到namenode下,重新命名為fsimage_txid，將edits_new檔案重新命名為edits_txid；最後，namenode載入新的fsimage，在fstime檔案中記錄下checkpoint發生的時間點。

另外，上圖中注意紅框部分，並不是把edits檔案直接更新到fsimage中，而是secondarynamenode先載入下載下來的fsimage，然後逐條執行edits中的記錄，最後重新生成一個新的fsimage。

關於namenode、datanode和secondarynamenode的互動過程

關於namenode、datanode和secondarynamenode的互動過程

Hadoop中NameNode、DataNode和Client三者之間的通訊方式是什麼？怎樣進行合作？

Hadoop介紹-4.Hadoop中NameNode、DataNode、Secondary、NameNode、JobTracker TaskTracker

u-boot、kernel和filesystem 執行過程分析

演變：機器學習和基於 Web 的體驗，快速、實時和完全互動

二十六、mongodb和python互動

Android 原始碼下載、編譯和刷機過程

802.11協議幀格式、Wi-Fi連線互動過程、無線破解入門研究

【JVM】類載入、連線和初始化過程

Hadoop之NameNode、DataNode

Java Socket(套接字)程式設計、TCP和UDP通訊過程詳解

hadoop中NameNode、DataNode、Secondary、NameNode、ResourceManager、NodeManager 介紹

Hadoop NameNode、DataNode熱遷移方案

分類模型的F1-score、Precision和Recall 計算過程

HTTP協議格式和header、互動過程

Qt入門之基礎篇 ( 二 ) ：Qt項目建立、編譯、運行和發布過程解析

利用navicat創建存儲過程、觸發器和使用遊標的簡單實例

Oracle03——遊標、異常、存儲過程、存儲函數、觸發器和Java代碼訪問Oracle對象

（轉）關於Tomcat的點點滴滴（體系架構、處理http請求的過程、安裝和配置、目錄結構、設置壓縮和對中文文件名的支持、以及Catalina這個名字的由來……等）

全網最詳細的再次或多次格式化導致namenode的ClusterID和datanode的ClusterID之間不一致的問題解決辦法（圖文詳解）

關於namenode、datanode和secondarynamenode的互動過程

相關推薦