1、提交sitemap即意味著google將會索引、收錄網頁
時常可以看到不少朋友在論壇中詢問諸如“我已提交了Sitemaps,為什么Google還未收錄我的網頁啊?”之類的問題,似乎在其潛意識里,只要在sitemaps中提交了相應網頁,Google便應該將其收錄。
這是很荒唐的理解,從最基本的角度,Sitemaps只是google向網站治理員提供的一個工具,盡管可以說是一個非常重要、有效的工具,但其只是對Google的索引收錄過程起一定的輔助作用,而決定Google是否會索引網站/網頁的最主要因素則在于Google對網站的信任度及網站是否具有良好的可索引架構等。
從這個意義上說,絕不能將Google Sitemaps理解成Google的“后門”――當然,這里的“后門”則是指一般意義上的后門,而不是我們那篇文章中的意思――盡管Sitemaps能夠幫助Google及時發現新的內容,提高Google 爬行與索引的效率,但它與Google是否一定會收錄或索引之間沒有什么必然的聯系。
比如說,假如Google對某個網站的信任指數較低,那么,其對該網站爬行索引的廣度與深度都存在很大限制(參見Matt Cutts的 Indexing Timelines),其Spider便不會在網站內充分索引,提交Sitemaps并不能改變這個由算法決定的選擇機制,即使Google通過 Sitemaps得到了網站內新網頁的URL,其同樣不會去索引那些頁面。
2、Sitemap中的網頁,或早或晚,都會被google收錄
這種想法的謬誤之處在上文已經涉及到部分,但是,就算網頁具有良好的導航架構,就算網站獲得了比較高的Google信任指數,也不能保證Sitemaps 中的URL都會被Google收錄。
另一個重要因素在于,網站/網頁則否對Spider友善,在很多時候,不要奢望Spider具有堅韌不拔專啃硬骨頭的“革命精神”,相反地,其有著“知難而退”的壞習慣,對于Sitemaps中其難以辨識或根本無法辨識的URL,是根本沒有愛好爬行的。
這就要求網站建設者以搜索引擎Spider的視角設計網頁,盡量避免在網頁鏈接中使用對Spider不友好的元素,比如說包含在Framesets中的URL對Spider而言是極其難以閱讀的,而JavaScipt中的URL則根本就是Spider看不到的等。
3、Sitemaps中應包含網站的全部內容
許多朋友在生成Sitemaps時,總怕有所遺漏,總想在Sitemaps包涵網站內的全部文件,結果,提交的Sitemaps往往十分龐大,不僅包括網頁URL,也包括網頁中的圖片、flash等等,事實上,這對Google的索引與收錄包括對網站最終的SEO效果,均沒有太大的實際意義,而且,過大的Sitemaps文件也是對服務器帶寬的巨大浪費,增加服務器的負擔。
當然,這并不是說在Sitemaps中不應該包含圖片文件,假如希望在Google圖片搜索中獲益,希望優化Google圖片搜索,在 Sitemaps中加入圖片文件也許會有所幫助――老實說,本人并不這么認為,不過,因未有明確證據,在此不敢斷言――不過,相比較而言,對圖片搜索來說,為圖片設置恰當的“alt” tag,使用有意義的文件名會有效得多。反觀一些朋友Sitemaps中的圖片文件URL,卻仍在使用如“1234567.gif”之類的文件名,這恐怕并不是一個好的選擇。
至于在Sitemaps中包含被robots.txt排除在外的網頁或使用“meta NOINDEX”的網頁URL,則更屬無意義之舉了。
4、使用Google sitemap能提高網站/網頁在SERP中的排名(或提高SEO效果)
Sitemaps只是在一定程度上提高網站頁面被收錄、索引的效率,從這個意義上說,對網站的整體SEO效果當然是有所助益的。
新聞熱點
疑難解答