一般百度K站的主要導(dǎo)火線之一就是網(wǎng)站內(nèi)容重復(fù),也有很多人的并不了解網(wǎng)站內(nèi)容重復(fù)的判斷依據(jù),而且也不清楚如何解決網(wǎng)站內(nèi)容重復(fù)的問題,其實(shí)網(wǎng)站內(nèi)容重復(fù)包括很多的方面,今天武林網(wǎng)小編針對幾種常見的情況進(jìn)行一一介紹,希望可以幫到大家。
一、網(wǎng)站內(nèi)容重復(fù)的情況
1、同樣一篇文章出現(xiàn)多個URL,即使這篇文章屬于原創(chuàng),也會被百度給予懲罰。
2、網(wǎng)站內(nèi)容多為采集,這種網(wǎng)站內(nèi)容重復(fù)會被當(dāng)做采集站直接被百度處理掉,百度新的綠蘿算法就是專門打擊采集站點(diǎn)的。
3、網(wǎng)站的固定版塊出現(xiàn)次數(shù)太多,很多網(wǎng)站的右側(cè)總是固定放一些版塊或欄目,這些欄目的內(nèi)容從來不進(jìn)行更新,或者各個頁面的右側(cè)都是前篇一律的內(nèi)容,就會造成頁面重復(fù)度高。
4、未設(shè)置404錯誤頁面,當(dāng)我們刪除某一個頁面的時候,一定要用404狀態(tài)碼給予用戶和蜘蛛一定的提示,如果代碼設(shè)置錯誤,那么刪除的頁面在蜘蛛那里是假想存在的,由此一來就會多次收錄。
5、動態(tài)頁面和靜態(tài)并存,百度爬去目錄時收錄了大量動態(tài)頁面
6、網(wǎng)站內(nèi)容以圖片為主,文字很少,很多圖片都是共用一個URL地址,這樣一來蜘蛛在索引的時候很難保證不被重復(fù)收錄。
重復(fù)內(nèi)容是指不同的URL鏈接內(nèi)容卻是相同的,同時收錄多個重復(fù)頁面,設(shè)置多個頁面進(jìn)行介紹,但是網(wǎng)頁的大體內(nèi)容是相同的,這樣處理的方法是錯誤的。

二、重復(fù)內(nèi)容的檢測方法
1、對于檢測一篇文章是否重復(fù)內(nèi)容,title:+文章標(biāo)題可找出相同的文章。
2、從文中摘取一段話,在百度搜一下,出現(xiàn)大量紅字,表明這篇文章的重復(fù)度高
3、站內(nèi)搜索,可以找到出現(xiàn)多次的內(nèi)容。
4、利用一些頁面相似度檢查工具,判斷一些相鄰頁面的相似度,80%以上相似度就需要對一些固定欄目進(jìn)行處理。
三、如何消除重復(fù)內(nèi)容
1、原創(chuàng)內(nèi)容的增加
對于網(wǎng)站內(nèi)容多為采集或簡單偽原創(chuàng)的網(wǎng)站,企贏001建議增加原創(chuàng)文章的內(nèi)容,寧可百度收錄少一些,也不要讓百度把之前收錄的文章吐出來。
2、網(wǎng)站固定欄目內(nèi)容隨機(jī)展示
可以根據(jù)正文的關(guān)鍵詞,隨機(jī)調(diào)用右側(cè)欄目的文章內(nèi)容,讓每一個頁面都有不一樣的內(nèi)容,避免大量頁面相似度高的情況出現(xiàn)。
3、設(shè)置404頁面
告知用戶和搜索引擎某些頁面不存在了,防止搜索引擎收錄大量死鏈。
4、頁面設(shè)置獨(dú)立的Meta標(biāo)簽
關(guān)鍵詞、標(biāo)簽、描述,每一個頁面都需要不同,可以采用手動修改,或者根據(jù)一定的規(guī)則設(shè)置。
當(dāng)你的網(wǎng)站內(nèi)容重復(fù)率并不高的時候,百度是不會惡意對網(wǎng)站進(jìn)行懲罰,除非競爭對手對網(wǎng)站惡意破壞,為了避免網(wǎng)站被K站的坑,我們需要先檢測網(wǎng)站的重復(fù)問題,以免給網(wǎng)站后期的維護(hù)帶來不必要的麻煩。
新聞熱點(diǎn)
疑難解答
圖片精選