欢迎光临
请一秒记住我们的网址:www.xinfans.com !

WordPress纯代码实现搜索引擎蜘蛛爬行记录

新站或网站收录有问题时,就会可能需求连续的搜索引擎蜘蛛的抓取环境。网站文章不收录时,第一时间就是要看看网站蜘蛛抓取的日志,但通过访问服务器的方式查看蜘蛛日志有点麻烦,我们可以用代码来实现给WordPress网站添加记录蜘蛛抓取日志的功能!

1.WordPress将以下代码复制主题functions.php文件中

// 记录蜘蛛访问记录
function get_naps_bot(){
$useragent = strtolower($_SERVER['HTTP_USER_AGENT']);
if (strpos($useragent, 'googlebot') !== false){
return 'Googlebot';
}
if (strpos($useragent, 'msnbot') !== false){
return 'MSNbot';
}
if (strpos($useragent, 'slurp') !== false){
return 'Yahoobot';
}
if (strpos($useragent, 'baiduspider') !== false){
return 'Baiduspider';
}
if (strpos($useragent, 'sohu-search') !== false){
return 'Sohubot';
}
if (strpos($useragent, 'lycos') !== false){
return 'Lycos';
}
if (strpos($useragent, 'robozilla') !== false){
return 'Robozilla';
}
return false;
}
function nowtime(){
date_default_timezone_set('Asia/Shanghai');
$date=date("Y-m-d.G:i:s");
return $date;
}
$searchbot = get_naps_bot();
if ($searchbot) {
$tlc_thispage = addslashes($_SERVER['HTTP_USER_AGENT']);
$url=$_SERVER['HTTP_REFERER'];
$file="robotslogs.txt";
$time=nowtime();
$data=fopen($file,"a");
$PR="$_SERVER[REQUEST_URI]";
fwrite($data,"Time:$time robot:$searchbot URL:$tlc_thispage\n page:$PR\r\n");
fclose($data);
}
创建robotslogs.txt文件在网站根目录下创建 robotslogs.txt 文件可写权限,最好是:777或755权限!

在完成上面的步骤之后,查看蜘蛛日志

访问域名+robotslogs.txt即可!https://域名/robotslogs.txt,
例:https://www.xinfangs.com/robotslogs.txt

赞(20) 打赏
文章名称:WordPress纯代码实现搜索引擎蜘蛛爬行记录
文章链接:https://www.xinfangs.com/907.html
版权声明:本站各种资源及插件大部分为网络搜集而来,如有侵犯版权的,请留言,本站将予以删除改正。
图片版权归属各自创作者所有,图片水印出于防止被无耻之徒盗取劳动成果的目的。

作者推荐

  •     小主,您等等奴家嘛。

评论 抢沙发

评论前必须登录!

 

请一秒记住我们的网址:www.xinfangs.com.

去投稿去留言

觉得文章有用就打赏一下文章作者

非常感谢你的打赏,我们将继续给力更多优质内容,让我们一起创建更加美好的网络世界!

支付宝扫一扫打赏

微信扫一扫打赏