国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > CMS > 織夢DEDE > 正文

織夢火車頭采集文章列表地址列表錯誤URL沒有協議頭是//解決方法

2024-07-12 09:11:37
字體:
來源:轉載
供稿:網友

今天打開火車頭采集器需要更新下織夢網站,可是點了開始后發現錯誤了重新修改了列表采集規則。沒仔細看等抓完300多個連接導入數據庫時發生錯了,仔細一看該目標站的文章列表頁將文章url地址做了處理。

織夢火車頭采集文章列表地址列表錯誤URL沒有協議頭是//解決方法

   表現:

   常規的文章列表文章URL應該是  <a  href="https://www.CUOxin.com/URL.html">才對,而該站處理成了<a  href="//www.CUOxin.com/URL.html">,就是把協議頭https或者http給取消了,這個 在一定程度上是可以防范很多采集程序,軟件,爬蟲的。采集后的地址列表會多一層網址,就成了https://www.CUOxin.com/www.CUOxin.com/URL.html,這樣的話就無法正確采集內容了。

   

解決方法:

   在網址獲取選項里點選“手動填寫鏈接地址規則”,

   右側腳本規則填寫【a class="item" href="[參數]" title="(*)" target="_blank">】這里的參數就是原始目前的不帶協議頭的網址。

    實際連接:填寫【http:[參數1]】如果該網站是https的這里就填寫【https:[參數1]】

   結果:

   以上操作后點獲取網址測試正確,從采集,入庫等都OK了。

    PS:

    這個網址問題以前看到過,用DEDECMS織夢采集就是網址錯誤,今天在火車頭上總算是解決了。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 呈贡县| 沂源县| 巨鹿县| 龙岩市| 黄平县| 宜章县| 鸡西市| 来宾市| 永昌县| 平定县| 平果县| 广平县| 垫江县| 逊克县| 紫金县| 同心县| 河津市| 无极县| 洛宁县| 岳阳市| 灵丘县| 涿州市| 名山县| 钦州市| 中西区| 乳源| 南华县| 唐河县| 集安市| 武宣县| 平邑县| 大厂| 凉城县| 平乡县| 阜平县| 吴川市| 象山县| 拉萨市| 花莲县| 曲松县| 洛南县|