国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 網站 > 幫助中心 > 正文

如果去除采集內容里的鏈接和廣告

2024-07-09 22:58:34
字體:
來源:轉載
供稿:網友

一般我們采集規則寫好后,比較郁悶的就是內容里的鏈接了,因為我不想看到內容里有別人網站的鏈接,當然更不用說廣告了。這里需要說明的是,下面的方式只可以替換掉一些規則或者相對規則的鏈接和廣告,只要那些比較變態的網站在內容里加很多隨機文字的,那就沒辦法了。

過濾廣告最簡單的方式是在“過濾廣告正則”的輸入框里輸入相應的正則,4.7以前的沒有帶,4.7以后的系統帶的有,下面是個比較全些的廣告過濾正則:

<a[!--ad--]>,</a>,<A[!--ad--]>,</A>,<div[!--ad--]>,</div>,<DIV[!--ad--]>,</DIV>,<iframe[!--ad--]</iframe>,<IFRAME[!--ad--]</IFRAME>

基本上已經夠了。

如果過濾內容里的鏈接呢?這里可以在 過濾選項 的 替換:(針對標題與內容) 里輸入正則,多個用逗號分開,但是不要在這里寫<a[!--ad--]>,</a>,<A[!--ad--]>,</A>,這樣的正則,因為這樣你會采不到頁面,呵呵,它把你采集的頁面都給過濾了。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 湖南省| 新沂市| 乐安县| 哈巴河县| 文成县| 白银市| 韶关市| 北安市| 浦江县| 怀来县| 晋宁县| 博白县| 定襄县| 昌邑市| 会理县| 根河市| 新邵县| 临朐县| 安远县| 淮南市| 白城市| 巴彦县| 图们市| 漾濞| 故城县| 砚山县| 仁化县| 来宾市| 苏尼特右旗| 民勤县| 元江| 锦州市| 运城市| 黎川县| 新乡县| 邓州市| 唐山市| 南郑县| 阿拉尔市| 聂拉木县| 浏阳市|