linux三大文件處理工具（grep/sed/awk）

阿新 • • 發佈：2018-08-17

i++ 數據 test font 文件名 span 工具 tro clas

grep, sed 與 awk 是linux三個很強大的文件處理工具。

gerp 查找, sed 編輯, awk 根據內容分析並處理。

現在我們去了解一下這三種文件處理工具有什麽不同（肯定不同了，要不然為什麽有三種。。。）

grep(關鍵字: 截取)

文本搜集工具, 結合正則表達式非常強大
主要參數 []

-c : 只輸出匹配的行
-I : 不區分大小寫
-h : 查詢多文件時不顯示文件名
-l : 查詢多文件時, 只輸出包含匹配字符的文件名
-n : 顯示匹配的行號及行
-v : 顯示不包含匹配文本的所有行(我經常用除去grep本身)

基本工作方式: grep 要匹配的內容文件名, 例如:

grep ‘test‘ d* 顯示所有以d開頭的文件中包含test的行
grep ‘test‘ aa bb cc 顯示在 aa bb cc 文件中包含test的行
grep ‘[a-z]\{5}\‘ aa 顯示所有包含字符串至少有5個連續小寫字母的串

grep是一個較為簡單的匹配關鍵字的文件處理工具

sed(關鍵字: 編輯)

以行為單位的文本編輯工具 sed可以直接修改檔案, 不過一般不推薦這麽做, 可以分析 standard input
基本工作方式: sed [-nef] ‘[動作]‘ [輸入文本]
-n : 安靜模式, 一般sed用法中, 來自stdin的數據一般會被列出到屏幕上, 如果使用-n參數後, 只有經過sed處理的那一行被列出來.
-e : 多重編輯, 比如你同時又想刪除某行, 又想改變其他行, 那麽可以用 sed -e ‘1,5d‘ -e ‘s/abc/xxx/g‘ filename
-f : 首先將 sed的動作寫在一個檔案內, 然後通過 sed -f scriptfile 就可以直接執行 scriptfile 內的sed動作 (沒有實驗成功, 不推薦使用)
-i : 直接編輯, 這回就是真的改變文件中的內容了, 別的都只是改變顯示. (不推薦使用)
動作:
a 新增, a 後面可以接字符串, 而這個字符串會在新的一行出現. (下一行)
c 取代, c 後面的字符串, 這些字符串可以取代 n1,n2之間的行
d 刪除, 後面不接任何東西
i 插入, 後面的字符串, 會在上一行出現
p 打印, 將選擇的資料列出, 通常和 sed -n 一起運作 sed -n ‘3p‘ 只打印第3行
s 取代, 類似vi中的取代, 1,20s/old/new/g

q 退出, 匹配到某行退出, 提高效率

r 匹配到的行讀取某文件例如: sed ‘1r qqq‘ abc , 註意, 寫入的文本是寫在了第1行的後邊, 也就是第2行

w file, 匹配到的行寫入某文件例如: sed -n ‘/m/w qqq‘ abc , 從abc中讀取帶m的行寫到qqq文件中, 註意, 這個寫入帶有覆蓋性.

舉例:
sed ‘1d‘ abc 刪除 abc 檔案裏的第一行, 註意, 這時會顯示除了第一行之外的所有行, 因為第一行已經被刪除了(實際文件並沒有被刪除,而只是顯示的時候被刪除了)
sed -n ‘1d‘ abc 什麽內容也不顯示, 因為經過sed處理的行, 是個刪除操作, 所以不現實.
sed ‘2,$d‘ abc 刪除abc中從第二行到最後一行所有的內容, 註意, $符號正則表達式中表示行末尾, 但是這裏並沒有說那行末尾, 就會指最後一行末尾, ^開頭, 如果沒有指定哪行開頭, 那麽就是第一行開頭
sed ‘$d‘ abc 只刪除了最後一行, 因為並沒有指定是那行末尾, 就認為是最後一行末尾
sed ‘/test/d‘ abc 文件中所有帶 test 的行, 全部刪除
sed ‘/test/a RRRRRRR‘ abc 將 RRRRRRR 追加到所有的帶 test 行的下一行也有可能通過行 sed ‘1,5c RRRRRRR‘ abc
sed ‘/test/c RRRRRRR‘ abc 將 RRRRRRR 替換所有帶 test 的行, 當然, 這裏也可以是通過行來進行替換, 比如 sed ‘1,5c RRRRRRR‘ abc

awk(關鍵字:分析&處理)

一行一行的分析處理 awk ‘條件類型1{動作1}條件類型2{動作2}‘ filename, awk 也可以讀取來自前一個指令的 standard input
相對於sed常常用於一整行處理, awk則比較傾向於一行當中分成數個"字段"(區域)來處理, 默認的分隔符是空格鍵或tab鍵
例如:
last -n 5 | awk ‘{print $1 "\t" $3}‘ 這裏大括號內$1"\t"$3 之間不加空格也可以, 不過最好還是加上個空格, 另外註意"\t"是有雙引號的, 因為本身這些內容都在單引號內
$0 代表整行 $1代表第一個區域, 依此類推
awk的處理流程是:
1. 讀第一行, 將第一行資料填入變量 $0, $1... 等變量中
2. 依據條件限制, 執行動作
3. 接下來執行下一行
所以, AWK一次處理是一行, 而一次中處理的最小單位是一個區域
另外還有3個變量,

NF: 每一行處理的字段數,

NR 目前處理到第幾行

FS 目前的分隔符
邏輯判斷 > < >= <= == !== , 賦值直接使用=
cat /etc/passwd | awk ‘{FS=":"} $3<10 {print $1 "\t" $3}‘ 首先定義分隔符為:, 然後判斷, 註意看, 判斷沒有寫在{}中, 然後執行動作, FS=":"這是一個動作, 賦值動作, 不是一個判斷, 所以不寫在{}中
BEGIN END , 給程序員一個初始化和收尾的工作, BEGIN之後列出的操作在{}內將在awk開始掃描輸入之前執行, 而END{}內的操作, 將在掃描完輸入文件後執行.
awk ‘/test/ {print NR}‘ abc 將帶有test的行的行號打印出來, 註意//之間可以使用正則表達式
awk {}內, 可以使用 if else ,for(i=0;i<10;i++), i=1 while(i<NF)
可見, awk的很多用法都等同於C語言, 比如"\t" 分隔符, print的格式, if, while, for 等等

awk 是相當復雜的工具, 真正使用時, 再補充吧.

linux三大文件處理工具（grep/sed/awk）

i++ 數據 test font 文件名 span 工具 tro clas grep, sed 與 awk 是linux三個很強大的文件處理工具。 gerp 查找, sed 編輯, awk 根據內容分析並處理。現在我們去了解一下這三種文件處理工具有什麽不同（肯定不同了，要

linux三大文件處理工具（grep/sed/awk）

linux三大文件處理工具（grep/sed/awk）

Linux文本處理工具之grep sed簡概

DBImport v3.5 中文版釋出：資料庫定時同步及文件生成工具（IT人員必備）

Linux的命令及三劍客（grep sed awk ）

Linux的文本處理工具淺談-awk sed grep

Linux練習題-文本處理工具sed（施工中）

Linux基礎知識：SHELL腳本；find查找、tar壓縮；sed文件處理工具

Linux篇 | 文本處理工具和正則表達式（一）

Linux篇 | 文本處理工具和正則表達式（二）

Linux文本處理工具之grep

Linux Shell 文本處理工具集錦

謝煙客---------Linux之文本處理三劍客之grep

文本處理工具之grep

Linux的文本處理工具

文件處理工具 gif合成工具文件後綴批量添加工具文件夾搜索工具重復文件查找工具網頁圖片解析下載工具等

企業網盤居然支持高速局域網文件傳輸工具（速度可達20M）

軟件卸載工具IObit Uninstaller7單文件綠色版（全功能版本）

文件處理工具：wc,cut,sort,uniq

Linux的文件同步工具rsync實戰

Linux練習題-文件查找（施工中）

linux三大文件處理工具（grep/sed/awk）

相關推薦