剖析HDFS的檔案讀寫

阿新 • • 發佈：2018-12-02

客戶端通過對DistributedFileSystem物件呼叫create()來新建檔案(步驟1)。DistributedFileSystem對namenode建立一個RPC呼叫，在檔案系統的名稱空間中新建一個檔案，此時該檔案中還沒有相應的資料塊(步驟2)。namenode執行各種不同的檢查以確保這個檔案不存在以及客戶端有新建該檔案的許可權。如果這些檢查均通過，namenode就會為建立新檔案記錄一條記錄，如果檢查未通過，會導致檔案建立失敗並向客戶端丟擲一個IOException。DistributedFileSystem向客戶端返回一個FSDataOutputStream物件，由此客戶端可以開始寫入資料。就像讀取事件一樣，FSDataOutputStream封裝一個DFSOutputStream物件，該物件負責處理datanode和namenode之間的通訊。


      圖-客戶端將資料寫入HDFS

在客戶端寫入資料時(步驟3)， DFSOutputStream將它分成一個個的資料包，並寫入內部佇列，稱為“資料佇列”(data queue)。DataStreamer處理資料佇列，它的責任是挑選出適合儲存資料複本的一組datanode，並據此來要求namenode分配新的資料塊。這一組 datanode構成一個管線——我們假設複本數為3，所以管線中有3個節點。DataStreamer將資料包流式傳輸到管線中第1個datanode，該datanode儲存資料包並將它傳送到管線中的第2個datanode。同樣，第2個datanode儲存該資料包並且傳送給管線中的第3個(也是最後一個)datanode (步驟4

)。
DFSOutputStream也維護著一個內部資料包佇列來等待datanode的收到確認回執，稱為“確認佇列”(ack queue)。收到管道中所有datanode 確認資訊後，該資料包才會從確認佇列刪除(步驟5)。

     如果任何datanode在資料寫入期間發生故障，則執行以下操作(對寫入資料的客戶端是透明的)。首先關閉管線，確認把佇列中的所有資料包都添加回資料佇列的最前端，以確保故障節點下游的datanode不會漏掉任何一個數據包。為儲存在另一正常datanode的當前資料塊指定一個新的標識，並將該標識傳送給namenode, 以便故障datanode在恢復後可以刪除儲存的部分資料塊。從管線中刪除故障datanode，基於兩個正常datanode 構建一條新管線。餘下的資料塊寫入管線中正常的datanode。namenode 注意到塊複本量不足時，會在另一個節點上建立一個新的複本。後續的資料塊繼續正常接受處理。

     在一個塊被寫入期間可能會有多個datanode同時發生故障,但非常少見。只要寫入了dfs.namenode.replication.min的複本數(預設為1),寫操作就會成功，並且這個塊可以在叢集中非同步複製，直到達到其目標複本數(dfs.replication的預設值為3)。

      客戶端完成資料的寫入後，對資料流呼叫close()方法(步驟6)。該操作將剩餘的所有資料包寫人datanode 管線，並在聯絡到namenode告知其檔案寫人完成之前，等待確認(步驟7)。namenode已經知道檔案由哪些塊組成(因為Datastreamer請求分配資料塊),所以它在返回成功前只需要等待資料塊進行最小量的複製。

寫流程簡化步驟：

1、客戶端向NameNode發出寫檔案請求。
2、檢查是否已存在檔案、檢查許可權。若通過檢查，直接先將操作寫入EditLog，並返回輸出流物件。
（注：WAL，write ahead log，先寫Log，再寫記憶體，因為EditLog記錄的是最新的HDFS客戶端執行所有的寫操作。如果後續真實寫操作失敗了，由於在真實寫操作之前，操作就被寫入EditLog中了，故EditLog中仍會有記錄，我們不用擔心後續client讀不到相應的資料塊，因為在第5步中DataNode收到塊後會有一返回確認資訊，若沒寫成功，傳送端沒收到確認資訊，會一直重試，直到成功）
3、client端按128MB的塊切分檔案。
4、client開始往datanode上傳第一個block（先從磁碟讀取資料放到一個本地記憶體快取），以pipeline（管道）的形式將packet寫入，並以packet為單位（一個packet為64kb），當然在寫入的時候datanode會進行資料校驗，它並不是通過一個packet進行一次校驗而是以chunk為單位進行校驗（512byte），第一臺datanode收到一個packet就會傳給第二臺，第二臺傳給第三臺；第一臺每傳一個packet會放入一個應答佇列等待應答。
（注：並不是寫好一個塊或一整個檔案後才向後分發）
5、最後一個datanode成功儲存之後會返回一個ack packet（確認佇列），在pipeline裡傳遞至客戶端，在客戶端的開發庫內部維護著”ack queue”，成功收到datanode返回的ack packet後會從”ack queue”移除相應的packet。
6、如果傳輸過程中，有某個datanode出現了故障，那麼當前的pipeline會被關閉，出現故障的datanode會從當前的pipeline中移除，剩餘的block會繼續剩下的datanode中繼續以pipeline的形式傳輸，同時Namenode會分配一個新的datanode，保持replications設定的數量。當一個block傳輸完成之後，client再次請求namenode上傳第二個block的伺服器。
7、寫完資料，關閉輸輸出流。
8、傳送完成訊號給NameNode。
（注：傳送完成訊號的時機取決於叢集是強一致性還是最終一致性，強一致性則需要所有DataNode寫完後才向NameNode彙報。最終一致性則其中任意一個DataNode寫完後就能單獨向NameNode彙報，HDFS一般情況下都是強調強一致性）

讀流程的簡化步驟：

1、使用HDFS提供的客戶端Client，向遠端的Namenode發起RPC請求。
2、Namenode會視情況返回檔案的部分或者全部block列表，對於每個block， Namenode都會返回有該block拷貝的DataNode地址。
3、客戶端Client會選取離客戶端最近的DataNode來讀取block；如果客戶端本身就是DataNode，那麼將從本地直接獲取資料。
4、讀取完當前block的資料後，關閉當前的DataNode連結，併為讀取下一個block尋找最佳的DataNode。
5、當讀完列表block後，且檔案讀取還沒有結束，客戶端會繼續向Namenode獲取下一批的block列表。
6、讀取完一個block都會進行checksum驗證，如果讀取datanode時出現錯誤，客戶端會通知Namenode，然後再從下一個擁有該block拷貝的datanode繼續讀。

HDFS檔案讀寫操作（通俗易懂）

首先來介紹兩個概念 ▪NameNode：領導級別。管 NameNode：領導級別。管理資料塊對映；處理客戶端的讀寫請求；配置副本策略；管理HDFS的名稱空間； DataNode：員工級別。負責儲存客戶端發來的資料塊block；執行資料塊的讀寫操作。理資料寫詳細步驟： 1、首先

3.2 HDFS檔案讀寫

第3章 HDFS：分散式檔案系統 3.2 HDFS檔案讀寫 3.2.1 檔案訪問許可權針對檔案和目錄，HDFS有與POSIX非常相似的許可權模式。一共提供三類許可權模式：只讀許可權（r）、寫入許可權(w)和可

學習筆記:從0開始學習大資料-5.hadoop hdfs檔案讀寫api操作

學習測試，網上下的程式碼，測試通過，助於理解讀寫程式流程 package com.linbin.testmaven; import java.net.URI; import java.text.SimpleDateFormat; import java.util.Date; import or

Hadoop之HDFS檔案讀寫過程

4.DFSOutputStream將資料分成塊，寫入data queue。data queue由Data Streamer讀取，並通知元資料節點分配資料節點，用來儲存資料塊(每塊預設複製3塊)。分配的資料節點放在一個pipeline裡。Data Streamer將資料塊寫入pipeline中的第

hdfs檔案讀寫bug2

多DFSClient同時寫同一個檔案，可能會導致以下異常。其中一個會獲取許可權寫，另外的應該會報異常。（但是獲取許可權的順序不太確定，也麼有深究） IOExceptionLease mismatch on xxxxx owned by DFSClient_NONMA

剖析HDFS的檔案讀寫

客戶端通過對DistributedFileSystem物件呼叫create()來新建檔案(步驟1)。DistributedFileSystem對namenode建立一個RPC呼叫，在檔案系統的名稱空間中新建一個檔案，此時該檔案中還沒有相應的資料塊(步驟2)。namenode執行各種不同的檢查

Hadoop分散式檔案系統——HDFS的讀寫

HDFS是執行在通用硬體平臺上的可容錯分散式檔案系統。它優化了大檔案的流式讀取模式，適用於那些高吞吐並且對延遲性要求相對比較低的場景。它還通過檔案“一次寫入，多次讀取”的簡單策略保證了資料的一致性。HDFS亦使用了“塊複製”的概念，讓資料在叢集的

HDFS java介面——實現目錄增刪檔案讀寫

1、在Idea中，建立maven專案，選擇org.apache.maven.archetype:maven-archetype-quickstart，建立一個普通的Java專案（archetypeCatalog:internal），預設會建立 App 類。 2、新增依賴 <

hdfs——hadoop檔案讀寫操作

在hadoop中，有三大法寶——HDFS，MapReduce，Hbase，但是無論是MapReduce，Hbase還是hadoop中的其他元件如：Hive等他們要處理的資料還是處理完了的資料都是儲存在HDFS中。可見HDFS可以說是hadoop儲存的基礎和核心，

Java操作HDFS開發環境搭建以及HDFS的讀寫流程

Hadoop CDH HDFS Java操作HDFS 大數據 Java操作HDFS開發環境搭建在之前我們已經介紹了如何在Linux上進行HDFS偽分布式環境的搭建，也介紹了hdfs中一些常用的命令。但是要如何在代碼層面進行操作呢？這是本節將要介紹的內容： 1.首先使用IDEA創建一個ma

關於hadoop HDFS進行讀寫文件操作的問題

close config system inf () str on() exception oca 問題： java無法鏈接報錯顯示被拒絕鏈接剛開始一直以為是自己hadoop沒有配好（或者自己的jar包沒有導入好），開始就走偏了導致時間浪費原因是：hadoop沒有開

PGM格式影象檔案讀寫

private int mWidth; private int mLength; private int mColor;

Java 之檔案讀寫及效能比較總結

Java 之檔案讀寫及效能比較總結 2014年05月12日 17:56:49 閱讀數：21765 幹Java這麼久，一直在做WEB相關的專案，一些基礎類差不多都已經忘記。經常想得撿起，但總是因為一些原因，不能如願。其實不是沒有時間，只是有些時候疲於總結，今得空，下定決心

json.dump json.load與檔案讀寫操作

一.寫檔案 info={"name":"李小龍",'age':66,'love':"cat"} fp=open('testdict1.txt','w+',encoding='utf-8') fp.write(info) ls=list('1234567890') # print(ls) f

C檔案讀寫函式

fopen（）函式原型函式原型：FILE * fopen(const char * path, const char * mode); FILE *fp ; fp = fopen("D:\\a.txt","r"); \\是一種轉義字元，他表示一個\，就像\n表示回車一樣，即

NOIP複賽複習（三）檔案讀寫與數論模板

檔案讀入讀出假設題目名為“add”，那麼資料夾名為“add”，c++程式名為“add.cpp”，讀入檔名為“add.in”，輸出檔名為“add.out”。四個的拼寫均不可有誤，包括大小寫差異。千萬不要除錯後就忘記修改檔案讀入讀出了。 #include<cstdio&

C/C++檔案讀寫操作 —— windowsAPI

轉自：http://blog.sina.com.cn/s/blog_6e7fed390100z0j1.html 基於C的檔案操作在ANSI C中，對檔案的操作分為兩種方式，即流式檔案操作和I/O檔案操作，下面就分別介紹之。一、流式檔案操作這種方式的檔案操作有一個重要的結構

Python基本語法之文字檔案讀寫

檔案讀寫相關係統函式說明系統函式說明 input(tips); 提示使用者輸入資訊，例如 str = input("Please input your ip:") 將輸入的資訊賦值給變數

python學習（四）檔案讀寫

三種模式介紹：#r只讀模式，預設的，未指定模式時為只讀 r 開啟檔案不存在的話，會報錯； r+ 讀寫模式 #寫模式 w 會將原來檔案中的內容清空開啟檔案不存在的話，會新建一個檔案 w+ 寫讀模式，雖然能讀，但是因為把檔案內容清空了，讀到的就是空 #追加模式 a+ 追加讀模式

沉澱再出發：java的檔案讀寫

沉澱再出發：java的檔案讀寫一、前言對於java的檔案讀寫是我們必須使用的一項基本技能，因此瞭解其中的原理，位元組流和字元流的本質有著重要的意義。二、java中的I/O操作 2.1、檔案讀寫的本質概念框架： 1 方式

剖析HDFS的檔案讀寫

寫流程簡化步驟：

讀流程的簡化步驟：

相關推薦