1. 程式人生 > 實用技巧 >113資訊網-WordPress免外掛:實時搜尋引擎蜘蛛爬行記錄

113資訊網-WordPress免外掛:實時搜尋引擎蜘蛛爬行記錄

當一個新的網站建立的時候,我們特別喜歡有百度蜘蛛爬行我們的網站。
因為一旦爬行就能有頁面收錄,雖然不能百分之百收錄,最起碼總比沒有蜘蛛爬行強。

在新站或網站收錄有問題時,就會可能需求連續的百度引擎蜘蛛的抓取環境。
對於自己的網站的內容是否可以實時的收錄,一般我們站長都是會用站長工具去查,畢竟站長工具查詢有限,
所以就想著是不是有款外掛能無限許討的百度蜘蛛的歡心,這樣就能實時收錄本身的網頁,自己的網頁早一天收錄,
這樣自己就能得到流量的就會更多一點,那樣的話,自己的站就會越早盈利!

老規矩,站長秉持:“能不用外掛就不用外掛,這樣可以讓自己的站速度更快!”
線上實時觀察蜘蛛爬行記載。為此,function.php新增如下程式碼來完成這個功效:

// 記錄百度蜘蛛爬行
 
function get_naps_bot(){
 
$useragent = strtolower($_SERVER['HTTP_USER_AGENT']);
 
if (strpos($useragent,'googlebot') !== false){
 
return 'Googlebot';
 
}
 
if (strpos($useragent,'bingbot') !== false){
 
return 'Bingbot';
 
}
 
if (strpos($useragent,'slurp') !== false){
 
return 'Yahoobot';
 
}
 
if (strpos($useragent,'baiduspider') !== false){
 
return 'Baiduspider';
 
}
 
if (strpos($useragent,'sogou web spider') !== false){
 
return 'Sogouspider';
 
}
 
if (strpos($useragent,'haosouspider') !== false){
 
return 'HaosouSpider';
 
}
 
if (strpos($useragent,'yodaobot') !== false){
 
return 'YodaoBot';
 
}
 
return false;
 
}
 
function nowtime(){
 
date_default_timezone_set('Asia/Shanghai');
 
$date=date("Y-m-d G:i:s");
 
return $date;
 
}
 
$searchbot = get_naps_bot();
 
if ($searchbot) {
 
$tlc_thispage = addslashes($_SERVER['HTTP_USER_AGENT']);
 
$url=$_SERVER['HTTP_REFERER'];
 
$addr=$_SERVER['REMOTE_ADDR'];
 
$file="robotslogs.txt"; //根目錄下記錄蜘蛛爬行檔案
 
$time=nowtime();
 
$data=fopen($file,"a");
 
$PR="$_SERVER[REQUEST_URI]";
 
fwrite($data,"[$time] - $addr - $PR - $searchbot $tlc_thispage rn");
 
fclose($data);
 
}

  

接著在網站根目下建立一個名為 robotslogs.txt 的檔案。
需要把檔案: robotslogs.txt 設定可寫許可權,最好是:777許可權或者:755許可權。
某些Windows系統的主機配置以上程式碼可能無法進行蜘蛛爬行。
一般在24小時時間內,檔案:“robotslogs.txt”就會有蜘蛛爬行的記錄。
文章原文地址:https://www.113p.cn/414.html