国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 開發(fā) > XML > 正文

百度新聞開放協(xié)議XML文檔制作方法簡述

2024-09-05 20:55:26
字體:
供稿:網(wǎng)友
開放協(xié)議概述
使用此開放協(xié)議,將會為您的網(wǎng)站帶去更多流量!
《互聯(lián)網(wǎng)新聞開放協(xié)議》是百度新聞搜索制定的搜索引擎新聞源收錄標(biāo)準(zhǔn),網(wǎng)站可將發(fā)布的新聞內(nèi)容制作成遵循此開放協(xié)議的XML格式的網(wǎng)頁(獨(dú)立于原有的新聞發(fā)布形式)供搜索引擎索引,將網(wǎng)站發(fā)布的新聞信息主動、及時地告知百度搜索引擎。
采用了《互聯(lián)網(wǎng)新聞開放協(xié)議》,就相當(dāng)于網(wǎng)站的新聞被搜索引擎訂閱,通過百度——全球最大的中文搜索引擎這個平臺,網(wǎng)民將有可能在更大范圍內(nèi)更高頻率地訪問到您網(wǎng)站的新聞,進(jìn)而為您的網(wǎng)站帶來潛在的流量。
開放協(xié)議非常簡單! 您可以在我們的幫助下輕松使用。 開放協(xié)議內(nèi)容
下圖為遵照《互聯(lián)網(wǎng)新聞開放協(xié)議》制作的XML格式的網(wǎng)頁,網(wǎng)頁上按照標(biāo)準(zhǔn)格式列出了網(wǎng)站發(fā)布的新聞的相關(guān)信息。
XML網(wǎng)頁示例:
百度新聞開放協(xié)議XML文檔制作方法簡述
XML標(biāo)簽說明: 其中帶星號標(biāo)記的為必選項(xiàng),未帶星號標(biāo)記為可選項(xiàng)。
*<document>——標(biāo)記整個XML文件內(nèi)容的開始和結(jié)束。
*<webSite>——站點(diǎn)地址。
*<webMaster>——負(fù)責(zé)人員的Email。當(dāng)有必要時,我們通過這個地址與您聯(lián)系。
*<updatePeri>——更新周期,以分鐘為單位。搜索引擎將遵照此周期訪問該頁面,使頁面上的新聞更及時地出現(xiàn)在百度新聞中。
*<item>——標(biāo)記每篇新聞信息的開始和結(jié)束。標(biāo)記內(nèi)為單篇新聞信息,不包括新聞專題。
*<title>——新聞標(biāo)題。
*<link>——新聞url地址,與單篇新聞一一對應(yīng);若分頁的新聞存在多個URL,相當(dāng)于多篇新聞。
<description>——新聞內(nèi)容簡介。
*<text>——完整的新聞?wù)模▋H包含正文文字,不包含HTML語言等其它字符)。此項(xiàng)的目的是使該篇新聞更多、更準(zhǔn)地出現(xiàn)在搜索結(jié)果中。
*<image>——新聞?wù)膬?nèi)相關(guān)圖片,采用絕對地址。若該篇新聞無相關(guān)圖片,可以為空;若含有多張圖片,請重復(fù)使用該標(biāo)簽。此項(xiàng)的目的是使該篇新聞的相關(guān)圖片展現(xiàn)在搜索結(jié)果中。
<headlineImg>——為有可能成為頭條的新聞制作的頭條圖,采用絕對地址。
<keywords>——反映新聞主題內(nèi)容的一個或多個關(guān)鍵詞,關(guān)鍵詞之間以空格隔開。此項(xiàng)僅作為參考,檢索結(jié)果不完全依賴于此標(biāo)簽中的內(nèi)容。
<category>——新聞分類, 可以遵循網(wǎng)站自身的分類體系,最好采用一級分類。
<author>——新聞作者,可以為機(jī)構(gòu)或個人 。
<source>——新聞來源,即原創(chuàng)媒體或其它機(jī)構(gòu) 。
*<pubDate>——新聞發(fā)布時間,與該篇新聞HTML頁面上的發(fā)布時間保持一致。請精確到分鐘;若您網(wǎng)站的發(fā)布時間未記錄小時分鐘,提供年月日即可。
推薦時間格式:年月日小時分鐘秒
如:2005-11-09 10:37|2005/11/09 10:37:00|2005.11.09 10:37:00|
2005年11月09日10時37分00秒|Fri, 09 Nov 2005 10:37:00 GMT
開放協(xié)議使用
使用之前您需要了解以下幾點(diǎn): 無論您的網(wǎng)站已經(jīng)成為百度新聞源,還是尚未被百度新聞搜索收錄,都可以使用此開放協(xié)議。 您使用開放協(xié)議提供的內(nèi)容應(yīng)全部符合下面《新聞源收錄標(biāo)準(zhǔn)》。 《互聯(lián)網(wǎng)新聞開放協(xié)議》只是原始新聞源收錄方式的一種協(xié)助和有益補(bǔ)充,而不是完全取代。
新聞源收錄標(biāo)準(zhǔn):
百度希望新聞源多樣化,鼓勵原創(chuàng)新聞內(nèi)容。如果是具有大量有價值的新聞內(nèi)容并能及時更新的正規(guī)、合法媒體網(wǎng)站,且網(wǎng)站服務(wù)器穩(wěn)定、高速,就符合了百度收錄新聞源的基本原則。
百度新聞搜索收錄的內(nèi)容包括時政、娛樂、體育、財(cái)經(jīng)、科教文化、社會生活等各類新聞報(bào)道及媒體評論,數(shù)碼產(chǎn)品、房產(chǎn)、汽車等行情資訊及評測,各行業(yè)的動態(tài)及行情,組織機(jī)構(gòu)的工作動態(tài)等,是由專業(yè)人士撰寫或編輯的中文信息,不包括發(fā)布的個人信息、論壇、博客、廣告、幽默笑話、情感故事、情色、寫真、劇照、明星檔案、食譜、下載、多媒體等其它類型、其它語言互聯(lián)網(wǎng)信息。
您應(yīng)對提供的全部內(nèi)容承擔(dān)一切法律責(zé)任,保證您提供內(nèi)容的真實(shí)性、合法性,并不得侵犯任何第三方的權(quán)益。
下面就開始吧!
第一步:創(chuàng)建XML文件
請您在創(chuàng)建XML文件前務(wù)必閱讀百度新聞搜索的新聞源收錄標(biāo)準(zhǔn),并特別注意
1、百度新聞搜索收錄的新聞源網(wǎng)站必須符合及嚴(yán)格遵守國家《互聯(lián)網(wǎng)新聞信息服務(wù)管理規(guī)定》,并在新聞發(fā)布和轉(zhuǎn)載過程中尊重創(chuàng)作人和源網(wǎng)站的著作權(quán)。
2、百度新聞搜索不適合收錄的網(wǎng)站類型包括:論壇、博客、公司網(wǎng)站等。
3、百度新聞搜索不收錄個人信息、廣告、招標(biāo)、教程、幽默笑話、情感故事、情色、寫真、劇照、明星檔案、食譜、下載、多媒體等其它類型、其它語言互聯(lián)網(wǎng)信息。
4、百度新聞搜索希望收錄高質(zhì)量的中文新聞,不收錄英文等其它非中文新聞。
5、請按照上面公布的開放協(xié)議內(nèi)容制作XML文件。
其它說明:
支持的編碼格式有GB2312、GB18030、UTF-8、BIG5,推薦使用GB18030或UTF-8格式。 您可以將網(wǎng)站某一時間段發(fā)布的全部新聞放在一個XML文件中,也可以分頻道或欄目放在多個XML文件中。 請保持每個XML文件處于按更新周期持續(xù)自動更新狀態(tài)。更新周期可根據(jù)您的需要隨時進(jìn)行調(diào)整。 每個XML文件至多存放最新發(fā)布的100條新聞,無需保存之前的新聞。 請將發(fā)布的新聞按照時間排序,即最新發(fā)布的新聞在最上端,否則可能有新聞被遺漏。 XML標(biāo)簽內(nèi)容中,除文字文本以外不能包含其它任何代碼,下表中的特殊字符必須轉(zhuǎn)換為XML定義的轉(zhuǎn)義字符。否則將發(fā)生錯誤導(dǎo)致搜索引擎不能獲取頁面上的新聞。 字符 轉(zhuǎn)義后的字符 HTML字符 字符編碼 和(and) & &amp; &#38; 單引號 ' &apos; &#39; 雙引號 " &quot; &#34; 大于號 > &gt; &#62; 小于號 < &lt; &#60; 轉(zhuǎn)義字符中的"&"無需再轉(zhuǎn)。
建議您使用CDATA 部件。一個 CDATA 部件以"<![CDATA[" 標(biāo)記開始,以"]]>"標(biāo)記結(jié)束。將包含代碼或特殊字符的文本置于CDATA 部件內(nèi) ,就無需再對特殊字符進(jìn)行轉(zhuǎn)義。
第二步:驗(yàn)證XML文件
下面的地址提供了幫助您驗(yàn)證XML文件結(jié)構(gòu)的多種工具:
http://www.w3.org/XML/Schema#Tools
http://www.xml.com/pub/a/2000/12/13/schematools.html
通過驗(yàn)證的XML文件能夠使您提供的信息更加標(biāo)準(zhǔn),確保您發(fā)布的新聞信息不被搜索引擎遺漏。
第三步:提交XML網(wǎng)址
提交前請將XML文件上傳到您的網(wǎng)站服務(wù)器,將XML文件的URL地址及其它信息輸入下面對應(yīng)的方框內(nèi)。搜索引擎將定向訪問該URL地址,當(dāng)URL地址發(fā)生變化時需要重新提交。
若您的網(wǎng)站符合新聞源收錄標(biāo)準(zhǔn),百度新聞搜索將對您提交的數(shù)據(jù)進(jìn)行測試和觀察一周。如果XML文件基本按照 《互聯(lián)網(wǎng)新聞開放協(xié)議》的要求制作但存在問題,我們會根據(jù)XML頁面上提供的郵件地址與您聯(lián)系。
注意:
1、 我們將對您提交的XML文件進(jìn)行審核,百度新聞搜索不保證一定能收錄您提交的全部內(nèi)容。
2、站點(diǎn)名、地址為必填項(xiàng),同一站點(diǎn)一天之內(nèi)最多提交5個不同的XML文件地址。
3、提交地址后請您注意查看彈出窗口中的信息,以確認(rèn)是否提交成功。
第四步:查詢XML文件狀態(tài)
您可以在下面的方框中輸入您提交的XML文件地址,查詢該文件的處理進(jìn)度和反饋信息。
注意:輸入的地址必須完整,即與您提交時的地址完全一致。
發(fā)表評論 共有條評論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 桂阳县| SHOW| 泉州市| 阿拉善左旗| 喀喇沁旗| 辽宁省| 宜州市| 柳江县| 普安县| 西乌珠穆沁旗| 仙桃市| 和田县| 两当县| 巴林左旗| 酉阳| 泸定县| 宜兰县| 唐河县| 林甸县| 洪雅县| 遂昌县| 绿春县| 西充县| 沈阳市| 呼和浩特市| 葵青区| 普定县| 调兵山市| 台中市| 紫阳县| 大埔县| 万年县| 栾城县| 临潭县| 隆回县| 滦平县| 古丈县| 博兴县| 钦州市| 夹江县| 吉木乃县|