国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 網(wǎng)站 > 優(yōu)化推廣 > 正文

robots.txt主要作用

2024-04-26 14:00:29
字體:
供稿:網(wǎng)友

有些人會(huì)問,既然robots文件沒弄好,或出錯(cuò)了,會(huì)影響整個(gè)網(wǎng)站的收錄,那為什么還要這個(gè)文件呢?
其實(shí)robots是為有特別情況的站長準(zhǔn)備的,因?yàn)橛行┚W(wǎng)站,有一些頁面是站長不想被任何搜索引擎收錄的,所以才有了這個(gè)robots文件。
robots.txt文件用法舉例:
例1、禁止所有搜索引擎訪問網(wǎng)站的任何部分
User-agent: *
Disallow: /
例2、允許所有的robot訪問
User-agent: *
Disallow:
(或者也可以建一個(gè)空文件 "/robots.txt" file)
例3、禁止某個(gè)搜索引擎的訪問
User-agent: BadBot
Disallow: /
例4、允許某個(gè)搜索引擎的訪問
User-agent: Baiduspider
Disallow:
User-agent: *
Disallow: /
例5、假設(shè)某個(gè)網(wǎng)站有三個(gè)目錄對(duì)搜索引擎的訪問做了限制,可以這么寫:
User-agent: *
Disallow: /cgi-bin/
Disallow: /tmp/
Disallow: /joe/
需要注意的是,對(duì)每一個(gè)目錄必須分開聲明,而不要寫成:“Disallow: /cgi-bin/ /tmp/”。
User-agent:后的*(通配符) 具有特殊的含義,代表“any robot”,所以在該文件中不能有 “Disallow: /tmp/*” or “Disallow: *.gif ”這樣的記錄出現(xiàn)。
另外,robots.txt主要作用是保障網(wǎng)絡(luò)安全與網(wǎng)站隱私,百度蜘蛛遵循robots.txt協(xié)議。通過根目錄中創(chuàng)建的純文本文件robots.txt,網(wǎng)站就可以聲明哪些頁面不想被百度蜘蛛爬行并收錄,每個(gè)網(wǎng)站都可以自主控制網(wǎng)站是否愿意被百度蜘蛛收錄,或者指定百度蜘蛛只收錄指定的內(nèi)容。當(dāng)百度蜘蛛訪問某個(gè)站點(diǎn)時(shí),它會(huì)首先檢查該站點(diǎn)根目錄下是否存在robots.txt,如果該文件不存在,那么爬蟲就沿著鏈接抓取,如果存在,爬蟲就會(huì)按照該文件中的內(nèi)容來確定訪問的范圍。

來源:seo優(yōu)化網(wǎng) 轉(zhuǎn)載注明出處!

發(fā)表評(píng)論 共有條評(píng)論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 房产| 睢宁县| 叶城县| 胶南市| 青浦区| 泉州市| 揭东县| 罗田县| 榆树市| 和田市| 长葛市| 辽宁省| 高淳县| 诏安县| 盈江县| 石台县| 桑日县| 扶沟县| 尉氏县| 济宁市| 浮梁县| 西贡区| 永丰县| 启东市| 乌审旗| 黔东| 浦东新区| 江西省| 泾源县| 清镇市| 栖霞市| 疏附县| 绩溪县| 泽库县| 海伦市| 桂平市| 年辖:市辖区| 扎鲁特旗| 丘北县| 志丹县| 永福县|