国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > CMS > Wordpress > 正文

WordPress博客如何記錄搜索引擎蜘蛛爬行痕跡

2024-09-07 00:50:09
字體:
來源:轉載
供稿:網友

要統計蜘蛛爬行痕跡我們在php中使用HTTP_USER_AGENT獲取用戶行為信息,然后再判斷是不是包括搜索引擎蜘蛛的相關參數了,如果有就是搜索引擎蜘蛛了.

WordPress博客記錄搜索引擎蜘蛛爬行痕跡插件:

1、搜索引擎蜘蛛爬行記錄器Spider Tracker插件可以記錄百度、谷歌、雅虎、必應、搜狗、搜搜6種搜索引擎的蜘蛛爬行痕跡,并生成統計圖表,可以清晰的看到,近6日的各種搜索引擎的蜘蛛數量,以及當日的哪些時間,蜘蛛來過站里,又抓取了哪些網址。

2、wp-log-robots 插件大小僅3KB,wp-log-robots是一個記錄搜索引擎蜘蛛爬蟲活動記錄的WordPress插件,插件主文件只有一個 wp-log-robots.php,關鍵它的統計數據不用添加到數據庫中,而是以文本文件記錄下來的,比如你的博客地址是:http://www.survivalescaperooms.com,那么機器人日志文件的存放位置是:/robots_log.txt 。我們只要把這個地址添加到搜藏夾,就可以方便的查看各個搜索引擎的抓取情況。

在博客后臺插件-安裝插件-搜索“wp-log-robots”-點擊現在安裝,然后再插件頁面啟用該插件,不需要設置,就會開始記錄搜索引擎機器人的爬行記錄,提示:插件剛啟動的時候robots_log.txt 文件還沒有建立,是個404頁面,要等有搜索引擎來過之后,才會建立這個文件.)

WordPress博客記錄搜索引擎蜘蛛爬行痕跡代碼:

1.首先,在wordpress主題根目錄建立一個robots.php文件,寫入以下內容,支持搜索引擎如下,可以記錄Baidu,Google,Bing,Yahoo,Soso,Sogou,Yodao爬行網站的記錄! 

php代碼如下:

  1. <?php  
  2. function get_naps_bot()  
  3. {  
  4. $useragent = strtolower($_SERVER['HTTP_USER_AGENT']);  
  5. if (strpos($useragent'googlebot') !== false){  
  6. return 'Google';  
  7. }  
  8. if (strpos($useragent'baiduspider') !== false){  
  9. return 'Baidu';  
  10. }  
  11. if (strpos($useragent'msnbot') !== false){  
  12. return 'Bing';  
  13. }  
  14. if (strpos($useragent'slurp') !== false){  
  15. return 'Yahoo';  
  16. }  
  17. if (strpos($useragent'sosospider') !== false){  
  18. return 'Soso';  
  19. }  
  20. if (strpos($useragent'sogou spider') !== false){  
  21. return 'Sogou';  
  22. }  
  23. if (strpos($useragent'yodaobot') !== false){  
  24. return 'Yodao';  
  25. }  
  26. return false;  
  27. }  
  28. function nowtime(){  
  29. $date=date("Y-m-d.G:i:s");  
  30. return $date;  
  31. }  
  32. $searchbot = get_naps_bot();  
  33. if ($searchbot) {  
  34. $tlc_thispage = addslashes($_SERVER['HTTP_USER_AGENT']);  
  35. $url=$_SERVER['HTTP_REFERER'];  
  36. $file="www.survivalescaperooms.com.txt";  
  37. $time=nowtime();  
  38. $data=fopen($file,"a");  
  39. fwrite($data,"Time:$time robot:$searchbot URL:$tlc_thispagen");  
  40. fclose($data);  
  41. }  
  42. //http://www.survivalescaperooms.com收集整理  
  43. ?> 

將其上傳于你的主題目錄內.

2.在Footer.php或header.php的適當位置添加以下代碼調用robots.php,查看源代碼打印幫助:<?php include(’robots.php’) ?>

程序原理:通過對蜘蛛標識符(如Baiduspider、Googlebot)的判斷,記錄蜘蛛爬行時間,并生成日志文件robotslogs.txt于根目錄.

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 罗源县| 上杭县| 祁门县| 乐业县| 麟游县| 原平市| 兰坪| 通许县| 南岸区| 瓦房店市| 健康| 闽侯县| 邯郸市| 行唐县| 顺义区| 工布江达县| 庄河市| 大庆市| 色达县| 蓬莱市| 五峰| 纳雍县| 多伦县| 毕节市| 库车县| 太仆寺旗| 江华| 兰州市| 高平市| 江都市| 西峡县| 汶上县| 理塘县| 上思县| 阳西县| 镇雄县| 银川市| 丹寨县| 嵊泗县| 城固县| 林州市|