什么是robots.txt文件?
搜索引擎通過(guò)一種程序robot(又稱spider),自動(dòng)訪問(wèn)互聯(lián)網(wǎng)上的網(wǎng)頁(yè)并獲取網(wǎng)頁(yè)信息。
您可以在您的網(wǎng)站中創(chuàng)建一個(gè)純文本文件robots.txt,在這個(gè)文件中聲明該網(wǎng)站中不想被robot訪問(wèn)的部分,這樣,該網(wǎng)站的部分或全部?jī)?nèi)容就可以不被搜索引擎收錄了,或者指定搜索引擎只收錄指定的內(nèi)容。
因?yàn)閯倢懥?1是因?yàn)槎?jí)玉米泛濫和站點(diǎn)垃圾造成被封,去看見(jiàn)“眼鏡蛇”寫的是因?yàn)?1的robots.txt的原因。
我仔細(xì)看了51的robots.txt而最后要駁反“眼鏡蛇”的判定和定論!
每個(gè)站點(diǎn)都必須要有robots.txt嗎?
不一定,看情況
那么robots.txt是針對(duì)任何搜索引擎嗎?
不一定,搜索引擎的概念是什么先搞明白!至少他有蜘蛛,并且遵循robots.txt語(yǔ)法。像百度,google,yahoo都遵循
官方的robots.txt
robots.txt放在哪里?
根目錄下,就是通過(guò) http://www.abc.com/robots.txt等瀏覽訪問(wèn)到的!
robots.txt怎么寫?
請(qǐng)查詢:http://www.robotstxt.org/
因?yàn)檠坨R蛇說(shuō)百度殺了51是因?yàn)?1的robots.txt
“51.com搜索消失原因是公司想借機(jī)炒作?”
(聯(lián)系到五一國(guó)慶左右百度大規(guī)模檢查并封殺作弊網(wǎng)站,開始讓業(yè)界以為51.com是百度懲罰的網(wǎng)站之一,
通過(guò)某朋友提示到51.com的robots.txt文件,讓大家明白了百度網(wǎng)站只收錄一頁(yè)的原因,
并不是搜索引擎人為所至,而是51.com自身原因。 )
郁悶一:五一成“國(guó)慶”了!
郁悶二:robots.txt寫法遵循規(guī)則,搜索引擎也給予遵循!那么就是眼鏡蛇以上文章的判定錯(cuò)誤!不是51的robots.txt錯(cuò)誤!
分析反駁:
因?yàn)?1的主頁(yè)都在home下或者這個(gè)二級(jí)玉米下,那么就這個(gè)來(lái)說(shuō)!
1:http://www.51.com/robots.txt 18行
Disallow: /home/ (假設(shè)只針對(duì)百度,因?yàn)間oogle 沒(méi)把51怎么著,而之后分析則套用google的一些現(xiàn)象對(duì)比百度,除非他們不是一樣性質(zhì)的遵循robots.txt的搜索引擎!)
百度給出的定義:
"Disallow:/help/"則答應(yīng)robot訪問(wèn)/help.html,而不能訪問(wèn)/help/index.html
http://www.baidu.com/search/robots.html
那么就是說(shuō)在http://www.51.com/home/index.htm/index.html/index.shtml不能被收錄,因?yàn)閔ome目錄下無(wú)主頁(yè)!
http://www.51.com/home/index.htm 404錯(cuò)誤
http://www.51.com/home/index.html 404錯(cuò)誤
http://www.51.com/home/index.shtml 404錯(cuò)誤
http://www.51.com/home/index.php 404錯(cuò)誤
http://www.51.com/home/ 404錯(cuò)誤
新聞熱點(diǎn)
疑難解答
圖片精選