国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > CMS > 織夢DEDE > 正文

織夢自帶采集無法采集端口不為80的網(wǎng)址錯誤解決方法

2024-07-12 09:11:21
字體:
供稿:網(wǎng)友

織夢采集,一般用不到采集網(wǎng)址有端口的情況,少數(shù)有端口的網(wǎng)址就無法采集了。總結(jié)了下dede無法采集端口不為80的網(wǎng)址錯誤解決:

  問題描述,當(dāng)采集的網(wǎng)址后代端口時(為防止有推廣嫌疑就把網(wǎng)址換成xxx了。):

  測試采集網(wǎng)址:http://www.xxx.com:89/index.php/main/news/index.html?channel_id=104&page=1

  獲取的列表測試信息網(wǎng)址是不帶端口的結(jié)果是不帶端口的數(shù)組集合:

  測試的列表網(wǎng)址: http://www.xxx.com:89/index.php/main/news/index.html?channel_id=104&page=1

Array  (  [0] => Array  (  [title] => 講座回放|施奠東—西湖,世界風(fēng)景園林的  [link] => http://www.xxx.com/index.php/main/news/15529.html  [image] => http://www.xxx.com/uploadfiles/articles/20190528/15529.png  )  [1] => Array  (  [title] => 喜報|恭賀我院2019年度西湖杯榮獲佳績!  [link] => http://www.xxx.com/index.php/main/news/15528.html  [image] => http://www.xxx.com/uploadfiles/articles/20190522/15528.jpg  )  [2] => Array  (  [title] => 講座預(yù)告|西湖——世界風(fēng)景園林的杰出范  [link] => http://www.xxx.com/index.php/main/news/15526.html  [image] => http://www.xxx.com/uploadfiles/articles/20190516/15526.jpg  )  [3] => Array  (  [title] => 講座回放|胡理琛—西湖七十年流變憶勝  [link] => http://www.xxx.com/index.php/main/news/15524.html  [image] => http://www.xxx.com/uploadfiles/articles/20190513/15524.png  )  [4] => Array  (  [title] => 講座回放|彭嘉恒—“南師、禪及其在西方  [link] => http://www.xxx.com/index.php/main/news/15518.html  [image] => http://www.xxx.com/uploadfiles/articles/20190507/15518.png  )  [5] => Array  (  [title] => 講座預(yù)告|胡理琛—西湖七十年流變憶勝  [link] => http://www.xxx.com/index.php/main/news/15516.html  [image] => http://www.xxx.com/uploadfiles/articles/20190430/15516.jpg  )  )

  這樣顯然得到的網(wǎng)址是錯誤的。根本無法訪問,也就無法采集了。

  經(jīng)過一番查找,原來是dede 設(shè)置HTML的內(nèi)容和來源網(wǎng)址 的函數(shù)問題,漏寫端口判斷了。

  在include/dedehtml2.class.php

  function SetSource 函數(shù)里大概79行加上紅框里的內(nèi)容:

image.png

  再測試一下。ok 了,這樣網(wǎng)址就可以正常打開,采集到了。

  付上代碼:

function SetSource(&$html, $url = '', $linktype='')  {  $this->__construct();  $this->CAtt = new DedeAttribute2();  $url = trim($url);  $this->SourceHtml = $html;  $this->BaseUrl = $url;  //判斷文檔相對于當(dāng)前的路徑  $urls = @parse_url($url);  $port=$urls['port']=='80'?'':':'.$urls['port'];//lyy 為80時候可以省略,否則就加上  $this->HomeUrl = $urls['host'].$port;  $this->BaseUrlPath = $this->HomeUrl.$urls['path'];  $this->BaseUrlPath = preg_replace("///([^//]*)/.(.*)$/","/",$this->BaseUrlPath);  $this->BaseUrlPath = preg_replace("///$/",'',$this->BaseUrlPath);  if($linktype!='')  {  $this->GetLinkType = $linktype;  }  if($html != '')  {  $this->Analyser();  }  }

發(fā)表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發(fā)表
主站蜘蛛池模板: 靖西县| 安义县| 赤水市| 吉木萨尔县| 葫芦岛市| 济源市| 金川县| 长寿区| 龙岩市| 五寨县| 沅江市| 会宁县| 西畴县| 尚义县| 法库县| 岗巴县| 陈巴尔虎旗| 邮箱| 沙田区| 曲阳县| 平陆县| 楚雄市| 仪征市| 石嘴山市| 滦平县| 瑞安市| 广元市| 栾城县| 微山县| 龙里县| 呼图壁县| 新乡县| 黄平县| 那坡县| 开封县| 新乡县| 滁州市| 金华市| 寿阳县| 禹城市| 常德市|