關(guān)于百度對(duì)于原創(chuàng)內(nèi)容判斷的分析
大量復(fù)制內(nèi)容網(wǎng)站有的時(shí)候會(huì)影響關(guān)鍵字的排名。
比如說(shuō)原本是你寫(xiě)的文章,本來(lái)應(yīng)該排名很好,但是其他人抄襲或轉(zhuǎn)載你的文章,而且搜索引擎不幸的判斷那篇被抄襲或轉(zhuǎn)載的網(wǎng)頁(yè)是原始出處的話(huà),你應(yīng)有的排名就會(huì)被那個(gè)網(wǎng)頁(yè)奪走。
那么搜索引擎怎樣才能從多個(gè)網(wǎng)頁(yè)中挑出哪一個(gè)是原始出處呢?可能有以下幾個(gè)考慮:
1)網(wǎng)頁(yè)P(yáng)R值。網(wǎng)頁(yè)P(yáng)R值越高,被認(rèn)為是原始版本的可能性就越大。
2)網(wǎng)頁(yè)第一次被收錄的時(shí)間。網(wǎng)頁(yè)被搜索引擎收錄的時(shí)候越早,相比后發(fā)現(xiàn)的相同內(nèi)容的網(wǎng)頁(yè)來(lái)說(shuō),被當(dāng)作原始出處的可能性就越大。
3)域名注冊(cè)時(shí)間。越老的域名上面的網(wǎng)頁(yè)被當(dāng)成原始出處的可能性也越大。
4)網(wǎng)站的權(quán)威度。這就有點(diǎn)說(shuō)不清了,可能包含前面3個(gè)因素,還有很多其他因素。
但到目前為止,無(wú)論以哪一個(gè)因素為主,或怎樣組合這些因素,都不可能完全正確從多個(gè)網(wǎng)頁(yè)中挑出原始出處。
比如說(shuō)我這個(gè)博客就很新,域名也很新,文章被收錄的時(shí)間有的時(shí)候也不一定是最早的,就權(quán)威地位和被信任度來(lái)說(shuō),也肯定比不上很多中文網(wǎng)站。但我的博客新,我的域名新,并不意味著我的內(nèi)容就不是原始出處,實(shí)際上我的所有博客都是原創(chuàng)。
我最近也發(fā)現(xiàn)了很多網(wǎng)站都轉(zhuǎn)載,有的時(shí)候是抄襲我的博客內(nèi)容,很多網(wǎng)站的規(guī)模,歷史,PR值都比我的網(wǎng)站要高的多。
基于個(gè)人博客,谷歌更多給予內(nèi)容權(quán)重
1、谷歌比百度收錄更快,更能辨別原出處
今天網(wǎng)友有說(shuō),此前我寫(xiě)的一文,谷歌的搜索結(jié)果中,原文出去就是我的博客地址,排在第一位。
其實(shí),谷歌對(duì)于中文信息抓取速度之快,我早有切身感受。使用火狐瀏覽器以來(lái),安裝了谷歌工具條,默認(rèn)的搜索引擎就是谷歌。自己也常常就新寫(xiě)的博客日志進(jìn)行搜索,發(fā)現(xiàn)谷歌收錄的速度很快,有時(shí)半小時(shí)就可以收錄。
新聞熱點(diǎn)
疑難解答
圖片精選