下面是一篇來自seoMoz的關于搜索引擎如何評定鏈接價值的文章。
今天約見一個新客戶,這個客戶好奇地問我,搜索引擎是怎樣給某個網頁排名的,你推薦的這些SEO改動為什么會對排名的變動有影響,你在哪兒學的 SEO,你能不能給列一下你做一些比較好的SEO案例?當你進的項目進行到一定深度時,就會開始進行鏈接建設(外鏈建設)了。客戶想知道為什么鏈接建設那么重要?你就拉出那張“影響網站排名的因素”給他看,指出外鏈在影響網站搜索引擎排名所占的比重后,他們就會明白了,不過他們又有了另一個問題:
在網頁搜索引擎排名上,Google是怎樣決定某個鏈接帶給這個網頁多少排名分值呢?
為了回答這個問題,就順便寫了這篇博客。下面,你會發現很多最重要的影響搜索引擎判斷一個鏈接價值的因素和分析。
開始前,有一個很重要的概念需要說說:
頁面 vs 網站級別鏈接圖

可能你注意到了,搜索引擎已經越來越依賴對整個網站的評估多于對某個網頁的評估。這就是有時你會看到某些新網頁或者只有很少鏈接的網頁排名卻很高,僅僅因為它們是在一個重要的、被信任的和外鏈極好的網站(域名)上。在有關影響搜索引擎排名的因素調查中,我們稱之為“網站的權威性”,而且這個因素被 Google算法(按照投票集合的觀點)認為是最重要的。網站(域名)權威性可能基于網站鏈接圖來計算的,而不是基于網頁的鏈接圖,下面的列表里,一些標準可能只影響上面其中之一,一些則兩個都影響。
1. 內部鏈接和外部鏈接
當搜索引擎為了開始判斷某個網頁是否流傳廣泛(易IT注:流傳廣泛性,popularity)、重要性和相關性,并通過評價鏈接到這個網頁的鏈接打分時,它們發現一種經典的基于引用的規則,就是指其他人說你好頂過你自賣自夸說千句好要重要,也更可信。因此,內部鏈接雖然也會帶來某些分值和權重,但外部鏈接帶來的要多的多。

但這并不意味著有好的內部鏈接架構就不重要了,或者說對內部鏈接做的一切(有好的錨文本-Google叫定位文本,去掉不需要的鏈接等等)不重要了,只是說一個網站或某個網頁的在排名上的表現高度依賴別的網站怎樣引用和評價它們。
2。定位文本(錨文本,Anchor Text)
對SEO們來說,很明顯,總的來說定位文本在搜索引擎排名公式中是最重要的因素之一,所以不要驚奇在鏈接的眾多屬性中,搜索引擎特別關照這個定位文本的屬性。

我們的實驗(和以往很多經驗)顯示,“完全匹配(exact match)”的定位文本比那些只是被包含著目標關鍵字的定位文本要來的有益的多。個人觀點,搜索引擎不會遠離這個標準,尤其對于那些通用(不含品牌的)的關鍵短語來說,這也是造成很多對SERPs(搜索結果頁面)過于優化和修飾的原因。
3. PageRank(頁面排名)
無論這個頁面排名叫什么,微軟叫StaticRank,(Bing的Page Score可能也是其中之一,易IT注),Yahoo叫WebRank,Google叫PageRank,這些都是基于一種遞歸的、基于馬爾可夫鏈的鏈接分析算法,是所有搜索引擎排名系統的一部分。PageRank等排名系統使用的是一種投票的算法,而且和投票網頁的影響力和多少有關。
關于Pagerank(頁面排名)有幾點很很重要的基本概念需要知道:
每個網址(URL)天生就都被分配了一些數量的Pagerank。
如果一個網頁有“n”個鏈接,每個鏈接傳遞出去的頁面排名被那個網頁的頁面排名除于“n”(一個網頁上鏈接越多,那個網頁上每個鏈接傳遞出去的Pagerank就越低)
一種通過多次的迭代算法用來計算網絡的整個鏈接圖的流向,并以此計算出某個網址的排名分數。
在Google的工具條上的Pagerank數值是指數形式的頁面排名,所以頁面排名4比頁面排名3要重要8-10倍。
頁面排名可以通過頁面層次的鏈接圖來計算,并給出某個單獨的網址PageRank,但是頁面排名也可以通過在網站(域名)級別的鏈接圖來計算,通過計算網站間的鏈接來決定網站的重要性和排名。
4. 信任排名機制
關于信任排名機制的基本概念,請參考斯坦福的論文 - 用信任排名打擊網絡垃圾。信任排名的基本觀點就是互聯網上“好的”和“值得信賴”的網頁都緊密的鏈接在一起,然后讓垃圾網頁只能在這個核心外游蕩。因此,通過迭代算法和類似于頁面排名的衡量標準讓只有來自信任網站的源(trusted seed sources)傳遞更多的排名權重。信任排名可以用來預報某個網頁的質量高低和是否是垃圾網頁。

當搜索引擎不披露有關這個衡量標準的相關數據時,有可能某種“距離可信賴信息源距離“的公式應用在頁面排名的算法中。另一個有趣的地方是還有一個叫反-信任排名的指標,這個指標用來檢測誰鏈接到那些已知的垃圾站點上,這個可能也是影響排名的一個因素。頁面排名(pagerank)和信任排名(trustrank)(以及反-信任排名,reverse-trustrank)都可以在頁面層面級別和網站級別來計算排名。
從以上可以直覺地得到一點:從可以信賴的網站得到外鏈,而且不要鏈接到垃圾網站。
5. 域名的權威性
雖然“域名權威性(Domain Authority)”經常可以在SEO界看到(比如域名權威性在影響網站排名的因素中占有很大比重),但是一個正式的、通用的定義卻還沒有。大多數人都用它來描述搜索引擎根據一個網站的鏈接數據得來的綜合鏈接廣泛度、網站的重要性和可信賴程度。(可能有些搜索引擎還綜合一個域名存在的年限因素)
搜索引擎可能通過計算鏈接并定量地使用評分的方法來確定一個域名(網站)的權威性,而不是只用含糊的言語來描述,所以這是一個值得留意的數據。同時,你從獲得外鏈的域名得到的排名權重可能比單獨網頁得到的要重要(或重要的多)。
6. 外鏈鏈接源的多元性
在我們對相關數據的分析后發現,沒有哪個因素比來自網站根部的外鏈對排名的影響大。這顯示出這是一個很難控制垃圾網站的指標也顯示出外鏈的重要性和廣泛性。
雖然沒有因果關系,但很多SEO都經驗主義地建議你外鏈網站的多樣性對你網站/網頁的排名有好處。根據這個邏輯,從一個曾經已經鏈接到你網站再得到鏈接比從一個全新的網站得到鏈接相比,對你的排名提升沒有任何價值。這同時說明,從那些本來就多樣性的網站得到的鏈接比那些低多樣性網站得到的鏈接有價值的多。
7. 外鏈來源和目標的唯一性
搜索引擎有自己的一套辦法來判定和預測網站間的關系和擁有關系。這包括(但不限于):
大量的共享和反向鏈接
域名注冊數據
共享域名主機IP地址或IP地址的C段
公開的收購和關聯交易信息
機器可以閱讀的公開市場協議
如果搜索引擎判斷兩個網站間預先存在某種關系,那么可能會對兩個網站間鏈接的“編輯性(editorial)”質量做抑制處理,它們可能會選擇降低分數或干脆忽略這些鏈接。傳聞在這種“網絡”中的鏈接傳遞很小的價值(尤其是利用經典的“網站范圍”建設鏈接策略形成的鏈接)。
8. 網頁頁面上鏈接的位置
微軟是第一個披露搜索引擎如何處理“區塊層級(block-level)”的(參見微軟研究所的文章VIPS : Vision-based Page Segmentation Algorithm基于視線的網頁頁面區域算法)。

從那以后,許多SEO都報告他們在Google和Yahoo!發現了同樣的效果和影響。對于我們也一樣,比如,在內部鏈接中,頁腳上的鏈接不可能提供和頁面頂部導航鏈接一樣的效果。還有報告說,為了與不斷泛濫的鏈接廣告做斗爭,搜索引擎們都降低了從邊欄和頁腳來的外部鏈接的分值(價值)。
SEO們都趨于同意一點:從網頁頁面“內容”部分來的鏈接是最有價值的,不管從排名價值來說還是從點擊流量來說。(關于頁面優化和關鍵字定位,請參考:網頁搜索引擎優化和關鍵字定位指南)
9. 網頁(網站)間內容主題的相關性
搜索引擎有很多方法對兩個網頁(網站)進行內容主題分析并判斷網頁(網站)間是否類似和相關。幾年前,Google實驗室推出一項自動分類工具,可以根據URL(網址)來預測任何虛擬內容的分類和子分類(包括醫療、房地產、市場營銷和運動等10多個分類)。有可能搜索引擎會使用這種自動主題分類系統來判斷網頁和鏈接的“相鄰性”,并作為提高網頁(網站)排名質量的一項額外措施。
我本身并不擔心主題相關性的有關問題,如果你從一個和主題無關的站點(比如新浪網)或一個主題明確的博客得到一個外鏈,我想這可能對你的排名有好處。我感覺這可能是搜索引擎為了防止垃圾鏈接或作弊行為說采取的一種分析手段。
10. 內容和上下文評估
雖然主題相關性能給搜索引擎提供鏈接間關系的有用信息,那么可能源鏈接所在的網頁頁面內容和上下文更能提供用于決定此鏈接傳給目標網頁的價值。在內容和上下文分析里,搜索引擎會通過機器分析/分詞來分析和辨析為什么這個鏈接會存在在這個網頁上。
當鏈接被特意編輯,產生某種模式。鏈接通過可接受的HTML規范、字詞用法、措辭等,嵌入到內容中,指向相關的內容來源。通過詳細的模式匹配(有可能通過學習大量的數據),搜索引擎可能會分辨出“符合規范的”和“特意編輯”的鏈接與故意隱藏的(通過作弊)間的區別,或者分辨出哪些是符合內容規范哪些是付費鏈接,等等。
11.地理位置
一個鏈接的地理位置高度依賴于這個網站所在的地理位置,不過搜索引擎,尤其是Google,可能會通過特定的方法來分析大量的數據來精細確認某個網站根域名、子域名或子目錄的地理信息。可能包括:
主機的IP地址的位置
頂級域名的后綴中的國家代碼(比如.cn,.com.cn,.co.uk等)
內容的語言
在本地搜索引擎或地區性網站目錄中的注冊情況
和具體物理地址(實際地址)相關聯
指向網站(或某個欄目)鏈接的地理位置
從某個指定地區的網站得到外部鏈接可以幫助網頁(或整個網站)在那個地區的搜索中排名更好。同樣的,如果你的鏈接信息顯示你強烈傾向于某個地域,那么可能你在其他地方就表現的差點,即使你網站的某些地域信息顯示你是現在的地方(比如網站主機的IP地址,域名后綴等)。
12. Rel=“nofollow”的使用
雖然在SEO的世界里,nofollow議題好像已經出現了很久,其實這個用法開始與2005年的一月,從Google宣布她會支持新的HTML標簽開始。非常簡單,rel=“nofollow”這個標簽告訴搜索引擎,這個鏈接不是我特意推薦和“選出”(vote)的,你不用再往前走了,這會提升這個頁面本身在搜索引擎查詢中獨立的排名標準。今天,我們統計了一下,在互聯網上大約有3%的鏈接采用了nofollow,而且,大概有一半的網站在內部使用了nofollow,遠比用在外部鏈接上的多的多。

在SEO圈子里,對不同的搜索引擎是否、如何及怎樣嚴格地遵守這個nofollow協議,大家還存在一些疑問。不過一般說來,舉例來說,雖然Wikipedia的外部鏈接都采用了nofollow標簽,但Google還是對這些引用外部的鏈接有些許的排名分數。
13. 鏈接類型
鏈接有很多類型和形式,最大的3類是:
直接使用HTML文字鏈接
圖片鏈接
Javas
Google近日宣布他們不僅抓取這些鏈接,而且還通過他們傳遞排名評價分數(那些使用Javas
但是,不是所有類型的鏈接都是被平等對待的。在一些閑暇的測試和樣例中顯示,直接的含有錨文字的HTML鏈接傳遞最多的排名價值,接下來就是富含關鍵字alt屬性的圖片鏈接,最后就是javas
14. 鏈接到源頁面的其他鏈接
當頁面上的鏈接鏈到外面去時,這個頁面上的數量和目標也可能被作為評價因素計入傳遞排名價值中去。
正如我們在3中提到的,搜索引擎類似“頁面排名”(pagerank)似的算法會把頁面上的排名值除以鏈接數然后再傳遞出去。再補充一點,搜索引擎可能把鏈接到外站的數量作為一個判斷這些鏈接的質量和價值的因素。假如,例如,一個網頁只鏈接到某個主題的很少幾個資源上,
15. 針對域名,網頁和鏈接有關的懲罰
最近,每個SEO公司和個人都知道,搜索引擎的懲罰能使某個網站喪失傳遞排名價值的能力。如果一個網站失去這個推薦鏈接的能力,則從這個網站獲得的外鏈將沒有搜索引擎的排名價值。有時搜索引擎會公布一些懲罰。
16. 內容/嵌入模式
由于網站內容許可和分發、網站嵌入類小工具、各類積分排名和分布式的嵌入性鏈接變得越來越流行,搜索引擎已經開始尋找方法以防淹沒在這類技術中。我不相信搜索引擎們不想要這種大量的鏈接來應用于他們的系統,可能他們只是擔心過度計入和過度突出某個網站。
最后,我認為內容模式探測和鏈接模式探測在搜索引擎如何評估鏈接的多樣性和質量中扮演了一個重要的角色。如果搜索引看到,比如,一段有相同鏈接的文字存在于千百個站點上,那可能并不表示一個級別的推薦。“編輯性”(editorial)的本質是高度相同的文章片段,在那些明顯不同,自動生成的鏈接可能被打敗,但是從搜索引擎的焦點看,如果能夠分辨和過濾有這些屬性的鏈接將被證明是對付人為操縱的有效方法。
17. 社會性和歷史數據
鏈接出現的時間和數據是這個列表的最后一項。當搜索引擎爬行網絡并查看模式看是否是新網站,新網頁和舊的高分鏈接,他們使用這個數據來和垃圾網站戰斗,辨認權威性和相關性甚至傳遞很好的新鮮信息給網頁可以很容易獲得很多外鏈。
搜索引擎如何使用這些吸引鏈接的模式還在辯論和觀察,但是這些數據肯定是被使用、處理和用來幫助排名算法做的更好(并且減少網絡上的垃圾鏈接在排名中的影響 - 尤其是大量的鏈接購買和濫用)
新聞熱點
疑難解答