国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 網站 > 建站經驗 > 正文

控制搜索引擎訪問和索引你的網站

2024-04-25 20:17:18
字體:
來源:轉載
供稿:網友
原文:controlling how search engines access and index your website
發表于: 2007 年 1 月 26 日 上午 11:36:00

我經常被問到 google(谷歌)和搜索引擎是怎樣運轉的。一個核心問題是:谷歌是怎樣知道一個網站的哪些部分是網站所有者想讓它們顯示在搜索結果中?網站內容發布者能夠指定部分網站不被搜索嗎?好消息是,網站內容發布者可以使用很多方法控制你們的網頁在搜索結果中的顯示。

文件 robots.txt 是這里的主角,該文件已經成為業界標準好多年了。它讓一個網站所有者控制搜索引擎訪問他們的網站。你可以用 robots.txt 不同層次地控制訪問,比如讓搜索引擎只訪問整個網站,單個目錄,特定類型的網頁,或者某一網頁。有效地使用 robots.txt 能讓你更好地控制對你的網站 的搜索,但是如何達到這一目標不是很顯而易見的。這是我們關于如何使用 robots.txt 來控制對你的網站的存取的一系列帖子的第一篇。

文件 robots.txt 有什么用?

互聯網真的很大。你只是不相信它是怎樣地無窮無盡地大。你也許認為維護網站耗費好多精力,但是那只是“網海一粟”。 (對 douglas adams 致以誠摯的道歉)

象谷歌這樣的搜索引擎會讀取所有信息并對這些信息索引,索引是為了讓一個搜索引擎對一些用戶查詢顯示與之相匹配的網頁。

為了做到這一點谷歌的一些電腦不斷抓取網站,他們有一個谷歌所知道的所有網站的名單,他們閱讀每個網站的所有網頁。所有這些機器被稱為謠 googlebot。一般來說,你是愿意讓 googlebot 訪問你的網站,這樣你的網頁才可以被人們在谷歌搜到。

然而,對你的網站上的某幾頁,你可能不想讓谷歌索引。舉例來說,你可能有一個目錄包含內部日志,或者你可能有些新聞文章只能在支付費用后才能訪問。你可以通過創建一個文本文件名為 robots.txt 的文件并把它放置在根目錄下來告訴谷歌爬蟲不要去抓取他們。文件 robots.txt 包含了一個搜索引擎不能訪問的頁面的清單。創建一個 robots.txt 是直截了當的,它允許你用一套精密分層控制搜索引擎對你網站的訪問。

精細控制

除了 robots.txt 文件讓您為你的一大堆文件簡潔明了給出指令外,你也可以利用 robots meta 標簽來精確控制對你的單個網頁的訪問。為了做到這一點,你只需要對你的 html 網頁添加特定的 meta 標簽來控制怎樣對單個網頁索引。歸而總之,robots.txt 和 meta 標簽讓你更靈活地表達復雜的訪問規定變得比較容易。

一個簡單的例子

這里是一個簡單的例子,它是一個 robots.txt 文件。

user-agent: googlebot
disallow: /logs/

user -agent 行指明下面部分的一套指令只是為 googlebot。所有主要搜索引擎都閱讀并聽從你放在 robots.txt 的指令。只要你愿意,你可以為不同的搜索引擎指定不同的規則。disallow 行告訴 googlebot 不能進入你網站的檔案日志子目錄。你放在日志目錄中的內容將不會顯示在谷歌搜索 結果中。

禁止訪問單個文件

如果你有一篇只有注冊用戶才能訪問的文章,你一定想讓它排除在谷歌的結果之外。為了做到這一點,你只需要在該文章對應的 html 文件中添加一個 meta 標簽。該文件的代碼的最開始有點像:

<html>
<head>
<meta name="googlebot" content="noindex">
...

這段代碼會阻止谷歌索引此文件。標簽 meta 特別有用,如果你只被允許編輯單個文件,而不是全站的 robots.txt。他們還允許你逐頁地指定復雜的訪問控制規定。

了解更多

你可以在 http://www.robotstxt.org/谷歌的站長幫助中心找到更多有關 robots.txt 的更多有用信息,包括:

如何構造一個 robots.txt 文件
對谷歌使用的每個 user-agent 的描述
如何使用模式匹配
要多久我們才重新抓取您的 robots.txt 文件?

我們也在我們的站長博客里寫了一些關于 robots.txt 的帖子,也許對你有用。例如:

使用 robots.txt 文件
googlebot 匯總

這里還有一個主要搜索引擎使用的機器人的有用清單:http://www.robotstxt.org/wc/active/html/index.html

下次……

即將推出:關于詳述 robots 和 metatags 使用的帖子,和關于一些對常見情況的具體例子。
上一篇:站長訪談:訪中國最大Web開發社群站長—藍色

下一篇:WordPress對搜索引擎更為友好的技巧和方法

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
學習交流
熱門圖片

新聞熱點

疑難解答

圖片精選

網友關注

主站蜘蛛池模板: 伊吾县| 炎陵县| 宜黄县| 松溪县| 乐至县| 威海市| 壤塘县| 廊坊市| 曲沃县| 财经| 舞钢市| 屏边| 迁安市| 桓仁| 南涧| 通江县| 三门峡市| 正蓝旗| 卢龙县| 永城市| 金华市| 信阳市| 盈江县| 淳安县| 西和县| 孟州市| 香格里拉县| 平罗县| 云浮市| 兰西县| 翁源县| 绥德县| 波密县| 家居| 汽车| 汕尾市| 遵义县| 博客| 金坛市| 溆浦县| 五原县|