1. 程式人生 > >文字搜尋工具 grep命令

文字搜尋工具 grep命令

做為一名猿類,檢視日誌,解決系統執行問題是必備的一項工作。我們聊聊linux中最常用的一種強大的文字搜尋工具grep命令。

grep全稱是Global Regular Expression Print,表示全域性正則表示式版本,它的使用許可權是所有使用者。grep命令是能使用正則表示式搜尋文字,並把匹 配的行打印出來。作為linux中最為常用的三大文字(awk,sed,grep)處理工具之一,掌握好其用法是很有必要的。

格式

grep [options]

選項

[options]主要引數:

-a或--text 不要忽略二進位制的資料。
-A<顯示列數>或--after-context=<顯示列數> 除了顯示符合範本樣式的那一列之外,並顯示該列之後的內容。
-b或--byte-offset 在顯示符合範本樣式的那一列之前,標示出該列第一個字元的位編號。
-B<顯示列數>或--before-context=<顯示列數> 除了顯示符合範本樣式的那一列之外,並顯示該列之前的內容。
-c或--count 計算符合範本樣式的列數。
-C<顯示列數>或--context=<顯示列數>或-<顯示列數> 除了顯示符合範本樣式的那一列之外,並顯示該列之前後的內容。
-d<進行動作>或--directories=<進行動作> 當指定要查詢的是目錄而非檔案時,必須使用這項引數,否則grep指令將回報資訊並停止動作。
-e<範本樣式>或--regexp=<範本樣式> 指定字串做為查詢檔案內容的範本樣式。
-E或--extended-regexp 將範本樣式為延伸的普通表示法來使用。
-f<範本檔案>或--file=<範本檔案> 指定範本檔案,其內容含有一個或多個範本樣式,讓grep查詢符合範本條件的檔案內容,格式為每列一個範本樣式。
-F或--fixed-regexp 將範本樣式視為固定字串的列表。
-G或--basic-regexp 將範本樣式視為普通的表示法來使用。
-h或--no-filename 在顯示符合範本樣式的那一列之前,不標示該列所屬的檔名稱。
-H或--with-filename 在顯示符合範本樣式的那一列之前,表示該列所屬的檔名稱。
-i或--ignore-case 忽略字元大小寫的差別。
-l或--file-with-matches 列出檔案內容符合指定的範本樣式的檔名稱。
-L或--files-without-match 列出檔案內容不符合指定的範本樣式的檔名稱。
-n或--line-number 在顯示符合範本樣式的那一列之前,標示出該列的列數編號。
-q或--quiet或--silent 不顯示任何資訊。
-R/-r或--recursive 此引數的效果和指定“-d recurse”引數相同。
-s或--no-messages 不顯示錯誤資訊。
-v或--revert-match 反轉查詢。
-V或--version 顯示版本資訊。
-w或--word-regexp 只顯示全字符合的列。
-x或--line-regexp 只顯示全列符合的列。
-y 此引數的效果和指定“-i”引數相同。
-o 只輸出文件中匹配到的部分。
--help 線上幫助。

grep命令常見用法

在檔案中搜索一個單詞,命令會返回一個包含“match_pattern”的文字行:

grep match_pattern file_name
grep "match_pattern" file_name

在多個檔案中查詢:

grep "match_pattern" file_1 file_2 file_3 ...

輸出除之外的所有行 -v 選項:

grep -v "match_pattern" file_name

標記匹配顏色 --color=auto 選項:

grep "match_pattern" file_name --color=auto

使用正則表示式 -E 選項:

grep -E "[1-9]+"
或
egrep "[1-9]+"

只輸出文件中匹配到的部分 -o 選項:

echo this is a test line. | grep -o -E "[a-z]+."
line.

echo this is a test line. | egrep -o "[a-z]+."
line.

統計檔案或者文字中包含匹配字串的行數 -c 選項:

grep -c "text" file_name

輸出包含匹配字串的行數 -n 選項:

grep "text" -n file_name
或
cat file_name | grep "text" -n

#多個檔案
grep "text" -n file_1 file_2

列印樣式匹配所位於的字元或位元組偏移:

echo gun is not unix | grep -b -o "not"
7:not

#一行中字串的字元便宜是從該行的第一個字元開始計算,起始值為0。選項 -b -o 一般總是配合使用。

搜尋多個檔案並查詢匹配文字在哪些檔案中:

grep -l "text" file1 file2 file3...

grep遞迴搜尋檔案

在多級目錄中對文字進行遞迴搜尋:

grep "text" . -r -n
# .表示當前目錄。

忽略匹配樣式中的字元大小寫:

echo "hello world" | grep -i "HELLO"
hello

選項 -e 制動多個匹配樣式:

echo this is a text line | grep -e "is" -e "line" -o
is
line
	 
#也可以使用-f選項來匹配多個樣式,在樣式檔案中逐行寫出需要匹配的字元。
cat patfile
aaa
bbb
	 
echo aaa bbb ccc ddd eee | grep -f patfile -o

在grep搜尋結果中包括或者排除指定檔案:

#只在目錄中所有的.php和.html檔案中遞迴搜尋字元"main()"
grep "main()" . -r --include *.{php,html}
	 
#在搜尋結果中排除所有README檔案
grep "main()" . -r --exclude "README"
	 
#在搜尋結果中排除filelist檔案列表裡的檔案
grep "main()" . -r --exclude-from filelist

使用0值位元組字尾的grep與xargs:

#測試檔案:
echo "aaa" > file1
echo "bbb" > file2
echo "aaa" > file3
	 
grep "aaa" file* -lZ | xargs -0 rm
	 
#執行後會刪除file1和file3,grep輸出用-Z選項來指定以0值位元組作為終結符檔名(),xargs -0 讀取輸入並用0值位元組終結符分隔檔名,然後刪除匹配檔案,-Z通常和-l結合使用。

grep靜默輸出:

grep -q "test" filename
	 
#不會輸出任何資訊,如果命令執行成功返回0,失敗則返回非0值。一般用於條件測試。

打印出匹配文字之前或者之後的行:

#顯示匹配某個結果之後的3行,使用 -A 選項:
seq 10 | grep "5" -A 3
5
6
7
8
	 
#顯示匹配某個結果之前的3行,使用 -B 選項:
seq 10 | grep "5" -B 3
2
3
4
5
	 
#顯示匹配某個結果的前三行和後三行,使用 -C 選項:
seq 10 | grep "5" -C 3
2
3
4
5
6
7
8
	 
#如果匹配結果有多個,會用“--”作為各匹配結果之間的分隔符:
echo -e "abcabc" | grep a -A 1
a
b
--
a
b

 

希望能對您的工作和學習有所幫助。

關注微信公眾號和今日頭條,精彩文章持續更新中。。。。。