HDFS在Linux中操作命令

阿新 • • 發佈：2018-12-22

HDFS簡介

1，HDFS概念：
分散式檔案系統

2，設計思路

（1）分而治之
大檔案切分成小檔案，多臺伺服器共同管理一個檔案
小檔案做備份，分散儲存到不同的伺服器上，做到可靠性不丟失
（2）HDFS設計思想

3，HDFS架構
在這裡插入圖片描述

4，HDFS特點
優點：

（1）構建在廉價的機器上
a: 通過多副本提高可靠性
b: 提供了容錯和恢復機制
（2）高容錯性
a. 資料自動儲存多個副本
b. 副本丟失後，自動恢復
（3）適合批處理
a. 移動計算而非移動資料
b. 資料位置暴露給計算框架
（4）適合大資料處理
a. 能夠處理GB、 TB、甚至 PB 級資料
b. 能夠處理百萬規模以上的檔案數量， 10K+節點規模
（5）流式檔案訪問
a. 一次性寫入，多次讀取。檔案一旦寫入，不能修改，只能追加
b. 保證資料一致性

缺點：

（1）不善於處理低延遲資料訪問
a. 比如毫秒級的資料儲存，它是做不到的
b. 適合高吞吐率的場景，就是在某一個時間寫入大量的資料
（2）不善於處理小檔案存取
a. 佔用 NameNode 大量記憶體，NameNode 的記憶體是有限的
b. 小檔案儲存的尋道時間超過檔案讀取時間，這違背了 HDFS 的設計原則
（3）不支援併發寫入、檔案隨機修改
a. 一個檔案只能有一個寫者
b. 僅支援檔案的追加（append），不支援檔案的隨機修改

HDFS的shell（命令列客戶端）操作

1，Hadoop叢集管理指令碼

Hadoop 安裝目錄 bin 目錄下的 hadoop 指令碼是最基礎的叢集管理指令碼，使用者可以通過該指令碼完成各種功能，如 HDFS 檔案管理、MapReduce 作業管理等。
使用方式：hadoop [–config confdir] COMMAND
<–config：是用於設定 Hadoop 配置檔案目錄，預設目錄為 ${HADOOP_HOME}/etc/hadoop/>

2，HDFS 管理命令 fs

在叢集正常執行的前提下，使用如下方法，進行 Shell 操作：
[[email protected] ~]$ hadoop fs
[[email protected] ~]$ hadoop fs -help
展示的是 HDFS 支援的命令列引數：
注意：
開始使用命令前，必須啟動 Hadoop。
以上指令均是在 Linux 命令列視窗介面操作。
[ ]表示可選引數，<>表示必須引數。

3，常用命令引數介紹

1，幫助：
 hadoop fs -help
 hadoop fs -help ls

2，HDFS上操作檔案或資料夾
-ls 顯示目錄資訊
hadoop fs -ls hdfs://hadoop01:9000/
Hadoop fs -ls /
-mkdir zaiHDFS上建立目錄
hadoop fs -mkdir /abc <單級建立》
hadoop fs -mkdir -p 123/as
-cp 從 HDFS 的一個路徑複製到 HDFS 的另外一個路徑
hadoop fs -cp /abc/** /123/abc
-mv 在 HDFS 目錄中移動檔案
hadoop fs -mv /abc/1.txt /123/abc/
-rm 刪除HDFS上的檔案或者資料夾
hadoop fs -rm /abc/1.txt <刪除HDFS上的檔案>
hadoop fs -rm -r /123/as <刪除HDFS上的資料夾>
-rmdir 刪除HDFS上的空目錄
hadoop fs -rmdir /123

3，上傳和下載檔案

-put 等同於copyFromLocal,從本地上傳檔案到HDFS
hadoop fs -put hadoop-2.6.5
hadoop fs -copyFromLocal hadoop-2.6.5
-get 等同於copyToLocal,從HDFS下載檔案到本地
hadoop fs -get hadoop1<檔案路徑> ./<下載到的路徑>
hadoop fs -copyToLocal /abc/1.txt Desktop/data/<重新命名>
-moveFromLocal 從本地剪下檔案到HDFS
hadoop fs -moveFromLocal /home/theone/Desktop/software/data/1.txt /abc
-moveToLocal 從HDFS剪下檔案到本地
hadoop fs -moveToLocal /abc/1.txt /home/theone/Desktop/software/data/
<命令無法實現，資料不能被修改>
-appendToFile 追加一個檔案內容到已經存在的檔案末尾
hadoop fs -appendToFile 2.txt /abc/2.txt
-getmerge 合併下載多個檔案
hadoop fs -getmerge /abc/*.txt ./all.txt

4，檢視文字內容

-cat 顯示檔案內容
hadoop fs -cat /abc/1.txt
-tail 顯示一個檔案最後1kb的內容
hadoop fs -tail /abc/1.txt
-text 將 HDFS 中檔案以文字形式輸出（包括 gz 包、jar 包等形式）<用cat會亂碼>
hadoop fs -text /abc/hadoop-2.6.5

5，修改許可權

-chmod 改變檔案許可權（命令的使用者必須是檔案的所有者或者超級使用者）
hadoop -chmod -R 600 /abc/1.txt
-chown 改變檔案的擁有者和所屬組（命令的使用者必須是檔案的所有者或者超級使用者）
hadoop -chown -R theone:theone /abc

6，統計 <## -h 以更易讀的位元組單位（K、M 等）顯示資訊>

-count 統計一個指定目錄下的目錄數、檔案數和位元組數。
hadoop fs -count -h /abc
-df 統計檔案系統的可用空間資訊
hadoop fs -df -h /abc
-du 統計資料夾的大小資訊 <## -s 只統計引數所佔用空間總的大小>
hadoop fs -du -h -s /abc

7，副本

-setrep 設定HDFS中檔案的副本數量
hadoop fs -setrep 3 /abc/1.txt
<## 這裡設定的副本數只是記錄在NameNode的元資料中，
是否真的會有這麼多副本，還得看DataNode的數量 >

HDFS在Linux中操作命令

HDFS簡介 1，HDFS概念：分散式檔案系統 2，設計思路（1）分而治之大檔案切分成小檔案，多臺伺服器共同管理一個檔案小檔案做備份，分散儲存到不同的伺服器上，做到可靠性不丟失（2）HDFS設計思想 3，HDFS架構 4，HDFS特點優點：

【Linux】Linux中常用操作命令

詳細信息 hadoop 用戶組軟件 name vim使用 title redhat tail Linux簡介及Ubuntu安裝常見指令系統管理命令打包壓縮相關命令關機/重啟機器 Linux管道 Linux軟件包管理 vim使用用戶及用戶組管理文件權限管理

Linux中常用操作命令

有用 lena 第一個字符 pda dha 查看加載 rmdir 結構常用指令 ls：顯示文件或目錄 -i：列出文件詳細信息（list） -a：列出當前目錄下所有文件及目錄，包括隱藏文件和文件夾（a） mkdir：創建目錄 -p：創建目錄，若無上級目錄則創建（

Linux中常用操作命令（轉）

備份並不會使用方法 nts 系統版本不定 vim常用相同 1、cd命令這是一個非常基本，也是大家經常需要使用的命令，它用於切換當前目錄，它的參數是要切換到的目錄的路徑，可以是絕對路徑，也可以是相對路徑。如： [plain] view plain

Linux系統中MySQL的常用操作命令

char OS var 權限記錄 port nis whereis null 服務： # chkconfig --list 列出所有系統服務# chkconfig --list | grep on 列出所有啟動的系統服務 # chkconfig -

Mac下如何用SSH連接遠程Linux服務器及Linux一些常用操作命令，更新中.....

oot .... 地址密碼 res ini 更新目錄讀寫 1、終端命令　　a).打開Mac的命令終端　　b).輸入ssh -p 22 [email protected] 它會提示你輸入密碼,輸入正確的密碼之後,你就發現已經登陸成功了.(22: 端口號 roo

redis常見資料型別操作命令，Java中使用Jedis操作Redis

redis常見資料型別操作命令可參考地址：Http://redisdoc.com/ Java中使用Jedis操作Redis： https://www.cnblogs.com/liuling/p/2014-4-19-04.html redis鍵（key）

mysql修改表結構 MySQL修改表結構操作命令總結 MySql資料庫在表中新增新欄位，設定主鍵，設定外來鍵，欄位移動位置，以及修改資料庫後如何進行部署和維護的總結 mysql 如何修改、新增、刪除表主鍵

MySQL修改表結構操作命令總結以下內容轉自：http://www.jb51.net/article/58079.htm 表的結構如下: 複製程式碼程式碼如下:

redis中各種資料型別對應的jedis操作命令

一、常用資料型別簡介： redis常用五種資料型別:string,hash,list,set,zset(sorted set). 1.String型別 String是最簡單的型別，一個key對應一個value String型別的資料最大1G。 String

php 中php-fpm 的重啟、終止操作命令

service nginx restart service php-fpm restart 檢視php-fpm程序數： ps aux | grep -c php-fpm 檢視執行記憶體 /usr/bin/php -i | grep mem 檢視php編譯引數 /us

kafka基本操作命令收集----持續更新中

檢視幫助資訊 bin/kafka-topics.sh --help 建立Topic bin/kafka-topics.sh --create --topic test0 --zookeeper 192.168.187.146:2181 --config max

Linux作業系統中常用的壓縮包格式及其操作命令

Linux作業系統中很多場景涉及到對檔案或者資料夾打包、壓縮（注意：打包和壓縮是兩個概念，在技術上也是不同層面的）。這裡大致總結了一下Linux下常見的各種壓縮包格式的壓縮、解壓方法，但是部分方法我沒有見過，也就不全，希望大家跟帖補充，我們將隨時修改完善，謝謝！ .tar 解包：tar xvf Fi

shell中date命令對month進行加減操作的bug

在大部分情況下這個命令執行正確。但是有些情況下這個命令會出現問題，比如當前日期是3月30、3月31、5月31等的時候，上面的命令得到的結果還是當月，而不是我們期望的上月。這個問題是怎麼產生的呢？比如噹噹前日期是5月31時，-1 month它只是將月份-1，就得到4月31，但是實際上4月只有30天，所以

MySQL資料庫中對資料表的操作命令

檢視當前資料庫中所有表 show tables; 查看錶結構 desc 表名; 建立表 auto_increment表示自動增長 CREATE TABLE table_name( column1 datatype contrai, column2 da

運維工作中sed常規操作命令梳理

轉載自：https://www.cnblogs.com/kevingrace/p/5949208.html sed是一個流編輯器(stream editor),一個非互動式的行編輯器。它一次處理一行內容。處理時，把當前處理的行儲存在臨時緩衝區中，稱為“模式空間”，接著用sed命令處理緩衝區中的內

python中檔案基本操作命令及注意事項

我們如果想通過程式去修改檔案的名字、刪除檔案或資料夾、獲得路徑下的檔案列表等等操作，python提供了有關這些操作的模組(os模組),需要匯入模組import os. 修改檔名字，刪除檔案:目錄相關

Linux中的檔案操作命令

需求一、建立新檔案語法： touch [路徑/檔名] 補充知識點：（1）、如果檔名前面帶的有路徑，則表示在指定的路徑下建立檔案，只有檔名沒有路徑的話，則預設在當前工作目錄下建立檔案；（2）

python中寫入檔案資料及檔案定位操作命令

如果我們向檔案中寫入資料的話，我們可以使用write()函式。寫檔案: #開啟檔案 f = open("./index.cpp","w") #1. 寫入資料 contents ="hello w

Linux中操作日誌檔案的命令

昨天總結了日誌的一些用法和在程式中打日誌的重要性，今天來說說如何看日誌，linux系統下如何檢視日誌。最常用的命令： tail -f + 日誌檔名這種方式可以檢視正在改變的日誌檔案，它會把日誌裡最尾部的內容顯示在螢幕上，並且不斷重新整理，使你看到最新的檔案內容。 ta

linux中常見的檔案操作命令

由於經常在linux釋出工程進行測試，所以要用到linux一些檔案操作命令，再此進行總結，以便以後忘記的時候檢視。改變目錄：cd 回到使用者目錄 cd或者cd~ 檢視當前目錄：pwd 檢視目錄下的檔案的詳細資訊:ls -l /tmp（顯示的最近一次修改

HDFS在Linux中操作命令

HDFS簡介

HDFS的shell（命令列客戶端）操作

相關推薦