113資訊網-WordPress免外掛:實時搜尋引擎蜘蛛爬行記錄
阿新 • • 發佈:2020-07-18
當一個新的網站建立的時候,我們特別喜歡有百度蜘蛛爬行我們的網站。
因為一旦爬行就能有頁面收錄,雖然不能百分之百收錄,最起碼總比沒有蜘蛛爬行強。
在新站或網站收錄有問題時,就會可能需求連續的百度引擎蜘蛛的抓取環境。
對於自己的網站的內容是否可以實時的收錄,一般我們站長都是會用站長工具去查,畢竟站長工具查詢有限,
所以就想著是不是有款外掛能無限許討的百度蜘蛛的歡心,這樣就能實時收錄本身的網頁,自己的網頁早一天收錄,
這樣自己就能得到流量的就會更多一點,那樣的話,自己的站就會越早盈利!
老規矩,站長秉持:“能不用外掛就不用外掛,這樣可以讓自己的站速度更快!”
線上實時觀察蜘蛛爬行記載。為此,function.php新增如下程式碼來完成這個功效:
// 記錄百度蜘蛛爬行 function get_naps_bot(){ $useragent = strtolower($_SERVER['HTTP_USER_AGENT']); if (strpos($useragent,'googlebot') !== false){ return 'Googlebot'; } if (strpos($useragent,'bingbot') !== false){ return 'Bingbot'; } if (strpos($useragent,'slurp') !== false){ return 'Yahoobot'; } if (strpos($useragent,'baiduspider') !== false){ return 'Baiduspider'; } if (strpos($useragent,'sogou web spider') !== false){ return 'Sogouspider'; } if (strpos($useragent,'haosouspider') !== false){ return 'HaosouSpider'; } if (strpos($useragent,'yodaobot') !== false){ return 'YodaoBot'; } return false; } function nowtime(){ date_default_timezone_set('Asia/Shanghai'); $date=date("Y-m-d G:i:s"); return $date; } $searchbot = get_naps_bot(); if ($searchbot) { $tlc_thispage = addslashes($_SERVER['HTTP_USER_AGENT']); $url=$_SERVER['HTTP_REFERER']; $addr=$_SERVER['REMOTE_ADDR']; $file="robotslogs.txt"; //根目錄下記錄蜘蛛爬行檔案 $time=nowtime(); $data=fopen($file,"a"); $PR="$_SERVER[REQUEST_URI]"; fwrite($data,"[$time] - $addr - $PR - $searchbot $tlc_thispage rn"); fclose($data); }
接著在網站根目下建立一個名為 robotslogs.txt 的檔案。
需要把檔案: robotslogs.txt 設定可寫許可權,最好是:777許可權或者:755許可權。
某些Windows系統的主機配置以上程式碼可能無法進行蜘蛛爬行。
一般在24小時時間內,檔案:“robotslogs.txt”就會有蜘蛛爬行的記錄。
文章原文地址:https://www.113p.cn/414.html