1. 程式人生 > >谷歌搜尋語法(二)高階語法

谷歌搜尋語法(二)高階語法

Google搜尋語法(二)高階語法

  通過上一篇部落格,我們介紹了google的基本搜尋語法,在生活中合理的運用這些搜尋語法就可以協助我們更加精確、高效的找到我們想要的結果。
  回顧一下這些基本的語法,發現這些語法只能做一些基本的搜尋而已,結果也不是特別的準確,而接下來,我將為大家介紹一些更加高階的搜尋語法,這些語法在日常生活中的應用就更加少了,但有時候卻能出奇制勝,幫助你解決一些搜尋難題。

1.intitle

  首先要介紹的就是“intitle:”的用法,這個串的作用是將搜尋的範圍侷限在標題上。在關鍵詞前面加上這個,就會只對網頁的標題進行搜尋並且配對,最後將結果返回給使用者。例如輸入“intitle:program moon”進行搜尋,就會返回如下圖所示的結果。
intitle:program moon


  
  但是可以看到,貌似搜尋結果中只出現了關於program的內容,而並沒有moon相關的內容,這裡其實還是牽扯到搜尋引擎的基礎布林邏輯問題,在intitle:語法上,google會檢索所有的網頁,只要出現program或者moon其中的一個就會被匹配,意料之中的是,關於program的內容肯定是要遠遠多於moon的內容的,所以搜尋結果裡關於program的內容佔據了主導,可以理解為moon這個關鍵詞被一定量的智慧忽略了。但是如果我們想要找到網頁標題中既有program又有moon的網頁呢?那麼我們就要使用“intitle:”的一個變體“allintitle:”,使用這個字首後,就能得到我們想要的結果了。如下圖所示,除了第一條為google的圖片推薦,其餘的結果中網頁的標題既含有program這個關鍵詞,又含有moon這個關鍵詞。
allintitle:program moon

2.intext

  看到這個單詞,大概就可以猜到它的意義了,“intext:”是用來搜尋網頁正文內容的,這樣就可以忽略網頁中的超文字連結、URL和題目。我們輸入“intext:2018 program”進行搜尋,結果如下圖所示,結果中顯示的網頁大部分標題幾乎沒有規律,但是網頁的索引中都包含著 “2018 program”,但是因為2018和program的同時出現的網頁實在比較少,兩個關鍵詞的關聯度實在不高(筆者此時的時間為2016年12月25日00:07:10),因為現在才是2016年,如果換成“2016 program”我相信應該會有更多的結果出現。但是我們要明白,這時搜尋引擎關注的內容是網頁的正文。與之相對應的也有一個變體:“allintext:”,用法和上面的“allintitle”相似,我就不做過多的介紹了。
intext:2018 program


  到這裡恐怕就有讀者要問了,這與我們平時的搜尋相比沒有什麼高階的地方啊?確實,就平時的搜尋來講,這個語法的意義確實不太重大,但是在某些領域,例如黑客作為一名攻擊者,構造好關鍵詞配合適當的語法就可以進行撒網式的攻擊,這個呢,我們點到為止,這裡就不談了。

3.inanchor

  這個語法的意思是在頁面的連結錨點進行搜尋。
 

 連結錨點指的是一個連結的描述文字,如這樣的一段HTML程式碼:<a href=https://www.baidu.com>百度</a>,連結的錨點就是“百度”了。(解釋來自於網友)

  我們搜尋“inanchor:login”就可以搜尋到有那些含有錨點的網頁了,如下圖所示。當然,這個語法也有一個變體“allinanchor:”,意思也與前面的類似。
inanchor:login

4.site

  這個語法是把搜尋限制在站點域名之內。例如我們搜尋“program site:google.com”,結果如下圖所示,這裡呢,我們通常不需要加上前面的www,這樣搜尋的結果就會是包括所有含有google.com域名的有關內容,包括頂級域名和二級域名甚至三級域名的內容。也就是說我們甚至可以通過搜尋,確定google.com大概有多少個子域名!
這裡寫圖片描述

5.inurl

  inurl:會將搜尋的範圍限制在URL或者網站的頁面上,這個語法對於查詢搜尋和幫助是很有用的,不僅適合我們普通的搜尋,在黑客搜尋中用處也很大。例如我們輸入“inurl:password”,結果如下圖所示,結果顯示了所有URL中含有password的網頁。另外,這個語法也有一個變體:“allinurl:”,用法與前面的相似。
inurl:password

  在黑客領域,inurl和site的使用是十分的頻繁的,利用他們組合可以搜尋到有用的資訊,如我們可以使用“site:google.com –inurl:www.google.com”,而這個語法的含義就是搜尋google到底有多少個子域名。

  這個的功能是查詢所有連結到某個特定URL上的列表。要注意的是,是特定的URL頁面,如輸入:“link:www.baidu.com”進行搜尋,如下圖所示,就會返回所有連結到百度主頁的網頁了。因此,我們同樣可以指定特定的URL頁面來進行搜尋。
link:www.baidu.com

7.cache

  Cache可以幫助我們查詢到google索引過的頁面副本,它最大的好處就是及時原始檔介面不存在了,或者變成了其它的內容,我們依然可以搜尋的到。例如輸入:“cache:www.baidu.com”,結果如下所示,可以看到,格式雖然亂糟糟的,但是依稀可以從中獲取一些有用的資訊的。在國內的搜尋引擎上,可能也有類似的功能,比如百度的網頁快照,其功能與這個類似。
cache:www.baidu.com
  

8.filetype

  filetype是指搜尋指定字尾的檔案。這個不太常用,但是在黑客領域有一定的作用。但是我們的重點是講解語法,所以這裡就一筆帶過(關於filetype的一些其他內容我會在以後的博文中展示),如下圖所示,輸入“filetype:mdb”,結果就會顯示出一些網站的資料庫檔案。
  filetype:mdb

9.related

  這個語法是用於搜尋語某些頁面相關的網站的,可以輔助我們搜尋同類的頁面。比如我們輸入“related:www.google.com”,顯示的結果都是一些其他的搜尋引擎。
related:www.google.com

10.info

  這個語法可以搜尋到關於一個URL的更多資訊的頁面列表,這裡的資訊包括這個網頁的cache,還有與這個網頁相似的網頁等等,注意下面的英文資訊就好。輸入“info:www.google.com”,結果如下圖所示。
info:www.google.com

至此,谷歌的搜尋語法基本上已經講完了。因為筆者是在數年前接觸黑客技術的學習的google搜尋語法,當時google可謂是黑客手中的一把大殺器(現在的google也有相當的作用)。時隔數年,我重新的回憶了一下google的一些語法,並且整理下來,分兩篇,基礎語法和高階語法,期間也查閱了不少資料,特此向幫助我的人致謝。如果文章中有什麼紕漏,還望各位不吝指出,我實在是不勝感激。聖誕節到了,也祝願各位聖誕節快樂!
2016年12月25日01:18:52

上述示例搜尋環境:
  搜尋引擎:google in English
  瀏覽器:chrome 54.0.2840.59 m
  搜尋時間:2016年12月24日