国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 學(xué)院 > 開發(fā)設(shè)計(jì) > 正文

手把手教你制作Google Sitemap(詳細(xì)制作教程和協(xié)議講解)

2019-11-18 19:18:34
字體:
供稿:網(wǎng)友
出處:嘟嘟老窩(BLOG)

熬了半個(gè)通宵,寫出了自己的Google SiteMap文件,在這里給出詳細(xì)編寫教程,愿對大家有所幫助。

Google SiteMap的作用及協(xié)議格式詳解

Google SiteMap PRotocol是Google自己推出的一種站點(diǎn)地圖協(xié)議,此協(xié)議文件基于早期的robots.txt文件協(xié)議,并有所升級(jí)。在Google官方指南中指出加入了Google SiteMap文件的網(wǎng)站將更有利于Google網(wǎng)頁爬行機(jī)器人的爬行索引,這樣將提高索引網(wǎng)站內(nèi)容的效率和準(zhǔn)確度。文件協(xié)議應(yīng)用了簡單的xml格式,一共用到6個(gè)標(biāo)簽,其中關(guān)鍵標(biāo)簽包括鏈接地址、更新時(shí)間、更新頻率和索引優(yōu)先權(quán)。

Google SiteMap文件生成后格式如下: <urlset xmlns="http://www.google.com/schemas/sitemap/0.84"> <url> <loc>http://www.survivalescaperooms.com</loc> <lastmod>2005-06-03T04:20-08:00</lastmod> <changefreq>always</changefreq> <priority>1.0</priority> </url> <url> <loc>http://www.survivalescaperooms.com/300687.html</loc> <lastmod>2005-06-02T20:20:36Z</lastmod> <changefreq>daily</changefreq> <priority>0.8</priority> </url></urlset>XML標(biāo)簽
  • changefreq:頁面內(nèi)容更新頻率。
  • lastmod:頁面最后修改時(shí)間
  • loc:頁面永久鏈接地址
  • priority:相對于其他頁面的優(yōu)先權(quán)
  • url:相對于前4個(gè)標(biāo)簽的父標(biāo)簽
  • urlset:相對于前5個(gè)標(biāo)簽的父標(biāo)簽
我將一句一句分解講解這個(gè)xml文件的每一個(gè)標(biāo)簽:
  1. <urlset xmlns="http://www.google.com/schemas/sitemap/0.84">這一行定義了此xml文件的命名空間,相當(dāng)于網(wǎng)頁文件中的<html>標(biāo)簽一樣的作用。
  2. <url>這是具體某一個(gè)鏈接的定義入口,你所希望展示在SiteMap文件中的每一個(gè)鏈接都要用<url>和</url>包含在里面,這是必須的。
  3. <loc>http://www.survivalescaperooms.com</loc>用<loc>描述出具體的鏈接地址,這里需要注意的是鏈接地址中的一些特殊字符必須轉(zhuǎn)換為XML(HTML)定義的轉(zhuǎn)義字符,如下表:
    字符轉(zhuǎn)義后的字符
    HTML字符字符編碼
    and(和)&&amp;&#38;
    單引號(hào)&apos;&apos;&#39;
    雙引號(hào)"&quot;&#34;
    大于號(hào)>&gt;&#62;
    小于號(hào)<&lt;&#60;
  4. <lastmod>2005-06-03T04:20:32-08:00</lastmod><lastmod>是用來指定該鏈接的最后更新時(shí)間,這個(gè)很重要。Google的機(jī)器人會(huì)在索引此鏈接前先和上次索引記錄的最后更新時(shí)間進(jìn)行比較,如果時(shí)間一樣就會(huì)跳過不再索引。所以如果你的鏈接內(nèi)容基于上次Google索引時(shí)的內(nèi)容有所改變,應(yīng)該更新該時(shí)間,讓Google下次索引時(shí)會(huì)重新對該鏈接內(nèi)容進(jìn)行分析和提取關(guān)鍵字。這里必須用ISO 8601中指定的時(shí)間格式進(jìn)行描述,格式化的時(shí)間格式如下:
    • 年:YYYY(2005)
    • 年和月:YYYY-MM(2005-06)
    • 年月日:YYYY-MM-DD(2005-06-04)
    • 年月日小時(shí)分鐘:YYYY-MM-DDThh:mmTZD(2005-06-04T10:37+08:00)
    • 年月日小時(shí)分鐘秒:YYYY-MM-DDThh:mmTZD(2005-06-04T10:37:30+08:00)
    這里需注意的是TZD,TZD指定就是本地時(shí)間區(qū)域標(biāo)記,像中國就是+08:00了
  5. <changefreq>always</changefreq>用這個(gè)標(biāo)簽告訴Google此鏈接可能會(huì)出現(xiàn)的更新頻率,比如首頁肯定就要用always(經(jīng)常),而對于很久前的鏈接或者不再更新內(nèi)容的鏈接就可以用yearly(每年)。這里可以用來描述的單詞共這幾個(gè):"always", "hourly", "daily", "weekly", "monthly", "yearly",具體含義我就不用解釋了吧,光看單詞的意思就明白了。
  6. <priority>1.0</priority><priority>是用來指定此鏈接相對于其他鏈接的優(yōu)先權(quán)比值,此值定于0.0 - 1.0之間
  7. 還有</url>和</urlset>,這兩個(gè)就是來關(guān)閉xml標(biāo)簽的,這和HTML中的</body>和</html>是一個(gè)道理
  8. 另外需要注意的是,這個(gè)xml文件必須是utf-8的編碼格式,不管你是手動(dòng)生成還是通過代碼生成,建議最好檢查一下xml文件是否是utf-8編碼,最簡單的方法就是用記事本打開xml然后另存為時(shí)選擇編碼(或轉(zhuǎn)換器)為UTF-8。
登陸Google提交你的SiteMap文件,讓Google開始爬行吧打開

https://www.google.com/webmasters/sitemaps/鏈接,如果還沒有注冊或者登陸Google,就先用自己的帳號(hào)登陸Google,登陸后轉(zhuǎn)到Y(jié)our Sitemaps狀態(tài)頁面,可以點(diǎn)擊那個(gè)Add a Sitemap + 跳轉(zhuǎn)到提交頁面進(jìn)行Sitemap文件的提交。建議文件放在你的站點(diǎn)根目錄下。給Google提交你的Sitemap URL后可以看見在列表里已存在,不過這時(shí)候還沒有生效,必須過幾個(gè)小時(shí)后Status欄變成OK表示正式生效,如果不是OK,可以查看Google給出的狀態(tài)標(biāo)示解釋看看是什么原因。
發(fā)表評(píng)論 共有條評(píng)論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 龙江县| 建瓯市| 成安县| 大姚县| 凤庆县| 柯坪县| 南川市| 高清| 额济纳旗| 寿阳县| 田林县| 磴口县| 昔阳县| 故城县| 万山特区| 安溪县| 宁都县| 桐城市| 郧西县| 泸州市| 天柱县| 禄劝| 贵州省| 新蔡县| 南京市| 延安市| 康马县| 黄浦区| 青铜峡市| 新化县| 阳高县| 井陉县| 嘉祥县| 天气| 吉安市| 卓尼县| 广宁县| 宝清县| 定兴县| 固安县| 上饶市|