百度收錄你的網頁,是百度派出蜘蛛,把你的頁面抓取到它的服務器里面。對了論壇,除了派出蜘蛛,百度還有一個《互聯網論壇收錄開放協議》:
《互聯網論壇收錄開放協議》是百度網頁搜索制定的論壇內容收錄標準,論壇網站可將論壇內發布的帖子制作成遵循此開放協議的 XML 格式的網頁供搜索引擎索引,將論壇發布的帖子主動、及時地告知百度搜索引擎。采用了《互聯網論壇收錄開放協議》,就相當于論壇中的帖子被搜索引擎訂閱,通過百度全球最大的中文搜索引擎這個平臺,網民將有可能在更大范圍內更高頻率地訪問到您網站論壇中的帖子,進而為您的網站帶來潛在的流量。
還是舉個例子吧,seo優化網(www.cuoXin.com),看看它的收錄,site: www.cuoXin.com), 到 2010 年 3 月 5 號早上,收錄了 6 萬 8 千 9 百個頁面,百度每天可以帶來 4000 多個 IP。它的 sitemap 在這里(http://www.zz1.com.cn/sitemap_baidu.xml)。完全遵循了開放協議的內容:
下圖為遵照《互聯網論壇收錄開放協議》制作的 XML 格式的網頁,網頁上按照標準格式列出了網站論壇發布的帖子的相關信息。 XML 標簽說明: 其中帶星號標記的為必選項,未帶星號標記為可選項。
* <document>——標記整個 XML 文件內容的開始和結束。后面的" xmlns:bbs =" http://www.baidu.com/search/bbs_sitemap.xsd"是該 xml 文件遵守百度《互聯網論壇收錄開放協議》的聲明,如沒有該段聲明,xml 文件不支持下面的<bbs:reply> 等語法。
*<webSite>——站點地址。
* <webMaster>——負責人員的 Email。當有必要時,我們通過這個地址與您聯系。
* <updatePeri>——sitemap 更新周期,以小時為單位。搜索引擎將遵照此周期訪問該頁面,使頁面上的內容更及時地被百度 spider 發現。
*<updatetime>——該 xml 文件最近一次的更新時間 。
* <version>——論壇所使用程序的版本。
* <item>——標記每個帖子信息的開始和結束,標記內為單個帖子信息。
* <link>——帖子的 url 地址,即帖子第一頁的地址,請盡量去除 url 中不必要的參數。
<title>——帖子標題。
<pubDate>——帖子主貼的發布時間 。
<bbs:lastDate>——帖子最后一條回復的發布時間 。
<bbs:reply>——帖子總的回復數,不包括主貼。
<bbs:hit>——帖子總的查看次數。
<bbs:mainLen>——帖子主貼的長度,單位字節 。
<bbs:boardid>——帖子所在版面,提供版面的 id 。
<bbs:pick>——是否設為精華,精華標為 1 ,非精華標為 0 。
推薦時間格式:年月日小時分鐘秒如:20051109 10:37 | 2005/11/09 10:37:00 | 2005.11.09 10:37:00 | 2005 年 11 月 09 日 10 時 37 分 00 秒 | Fri, 09 Nov 2005 10:37:00 GMT 。我們做好網站后,要到搜索引擎去提交網站,而這個協議的原理,等于提交每個帖子!
現在你明白了吧!我現在現在要做的,就是提交我們的帖子地址。當然,手工填寫這個 sitemap,也是可以的,但是太費勁了。我就見過一個哥們手工填寫,佩服啊。
seo優化網的sitemap是這樣的,自動生成的,方便哦!http://www.cuoXin.com/data/sitemap.html
新聞熱點
疑難解答