国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 網站 > 優化推廣 > 正文

文章為什么被重復收錄? 文章被百度重復收錄的原因及解決方法

2024-04-26 14:19:04
字體:
來源:轉載
供稿:網友
問題現象:

文章重復收錄comment-page-1與replytocom

點擊進入鏈接,除了原網頁,分別出現:

http://www.stcash.com/5273/comment-page-1

http://www.stcash.com/5273?replytocom=1989

前面一篇文章居然出現一個三級目錄,后面一篇文章又類似于動態網頁網址。我文章中是沒有這兩個鏈接地址的,查看網頁源碼,看出了一點端倪。

原因分析:

我發現了這兩個?replytocom=1989網址的來源:文章評論鏈接

文章重復收錄comment-page-1與replytocom

四個評論剛好對應四個replytocom,百度蜘蛛可能有一定的智能,四個replytocom網址中只收錄了一個,但是又不夠智能,沒有區分出來評論鏈接和原文鏈接對應的文章內容是相同的。

comment-page-1網址同樣是來源于評論鏈接,comment-page-1代表著評論頁面的第一頁。如果我的評論比較多,比如說有1000條評論,那么一頁肯定是顯示不下去的,就會出現comment-page-2,comment-page-3......這就是評論分頁功能,這個功能本質上是防止評論過多時,網頁會被拉的很長,導致網頁加載速度慢和用戶體驗差。但是不巧的是,百度蜘蛛依然不能識別出來這和原文

解決方法:

1、對于comment-page-1重復收錄,有兩種方式解決

1)在wordpress后臺關閉評論分頁

文章重復收錄comment-page-1與replytocom

2)修改robots.txt,加上一句項目的代碼

Disallow: /comment-page-

robots.txt在網站根目錄,使用 網址/robots.tx就可以看到設置的結果了。如果根目錄下沒有這個文件

wp-includes/funtion中有這么一段代碼:

  1. $output = "User-agent: */n";
  2. $public = get_option( 'blog_public' );
  3. if ( '0' == $public ) {
  4.     $output .= "Disallow: //n";
  5. else {
  6.     $site_url = parse_url( site_url() );
  7.     $path = ( !emptyempty$site_url['path'] ) ) ? $site_url['path'] : '';
  8.     $output .= "Disallow: $path/wp-admin//n";
  9. }

$output .= "Disallow: $path/wp-admin//n";  后面增加一句$output .= "Disallow: $path/comment-page-/n";

2、對于replytocom重復收錄,設置robots.txt文件

Disallow:/*?replytocom=

或者是加上對于包含replytocom的所有鏈接都加上nofollow鏈接

  1. add_filter('comment_reply_link', 'add_nofollow', 420, 4);
  2. function add_nofollow($link$args$comment$post){
  3.   return str_replace("href=""rel='nofollow' href="$link);
  4. }

以上就是對文章被百度重復收錄的原因及解決方法全部內容的介紹,更多內容請繼續關注武林網!

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 平阴县| 昆山市| 四子王旗| 临沂市| 德庆县| 东莞市| 建瓯市| 昌图县| 东兰县| 肃北| 白山市| 南丹县| 竹溪县| 荆门市| 五台县| 海淀区| 金山区| 历史| 福泉市| 江陵县| 万宁市| 温泉县| 阿勒泰市| 平乐县| 甘泉县| 延吉市| 望谟县| 昔阳县| 明溪县| 德兴市| 长垣县| 中江县| 雷山县| 贡觉县| 彭山县| 宁国市| 延边| 赤壁市| 晋宁县| 阜康市| 佛教|