国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 網站 > 建站經驗 > 正文

robots協議是什么?robots文件如何使用?

2024-04-25 20:46:00
字體:
來源:轉載
供稿:網友
 Robots協議 

  Robots協議,又稱為機器人協議,網站用來告知搜索引擎哪些頁面可以被抓取,哪些頁面不能被抓取的。體現在位于網站根目錄下的robots.txt文件中,它并不是一個命令,只是一種國際上通行的規范,將網站的一些不能被抓取的文件或者目錄,記錄在robots.txt中,當搜索引擎的蜘蛛訪問這個網站時候,首先就會去訪問robots文件,得知不能被抓取目錄和文件信息。 

  Robots文件的寫法 

  User-agent: * 這里的*代表的所有的搜索引擎種類,*是一個通配符 

  Disallow: /admin/ 這里定義是禁止爬尋admin目錄下面的目錄 

  Disallow: /admin/*.html 禁止訪問/admin/目錄下的所有以".html"為后綴的URL(包含子目錄)。 

  Disallow: /*?* 禁止訪問網站中所有包含問號 (?) 的網址 

  Disallow: /.jpg$ 禁止抓取網頁所有的.jpg格式的圖片 

  Disallow:/admin/adc.html 禁止爬取admin文件夾下面的adc.html文件。 

  Allow: 的用法同Disallow 相反 

  Sitemap: 告訴搜索引擎蜘蛛這個頁面是網站地圖 

  Robots案列說明 

  1, 禁止所有搜索引擎訪問網站的任何部分 

  User-agent: * 

  Disallow: / 

  2, 攔截子目錄中某個頁面之外的其他所有頁面 

  User-agent: * 

  Allow: /admin/login.html 

  Disallow: /admin/ 

  3, 要攔截對所有以 ABC 開頭的子目錄的訪問 

  User-Agent:* 

  Disallow: /ABC*/ 

  4, 要攔截對所有包含問號 (?) 的網址的訪問 

  User-agent: * 

  Disallow: /*?* 

  5, 要攔截以 .asp 結尾的網址 

  User-agent: * 

  Disallow: /*.asp$ 

  備注:1,*是通配符。2,?是匹配符。3,$是結束符 

  建議僅當您的網站包含不希望被搜索引擎收錄的內容時,才需要使用robots.txt文件。如果您希望搜索引擎收錄網站上所有內容,請勿建立robots.txt文件。 
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 台北市| 南乐县| 句容市| 阳春市| 永德县| 登封市| 赤水市| 焉耆| 大宁县| 白玉县| 平顶山市| 潢川县| 武邑县| 龙胜| 伊吾县| 静宁县| 类乌齐县| 德昌县| 泰宁县| 平舆县| 陇南市| 天台县| 云霄县| 双流县| 青河县| 新源县| 泽库县| 普兰店市| 思茅市| 枞阳县| 杭州市| 康保县| 浦江县| 临江市| 隆化县| 信宜市| 丹凤县| 夏邑县| 万全县| 泰和县| 会理县|