国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > CMS > 織夢DEDE > 正文

織夢dedecms采集中用到的一些過濾規則

2024-07-12 08:49:41
字體:
來源:轉載
供稿:網友
這篇文章主要為大家詳細介紹了織夢dedecms采集中用到的一些過濾規則,具有一定的參考價值,感興趣的小伙伴們可以參考一下,有需要的朋友可以收藏方便以后借鑒。

織夢dedecms的過濾規則寫起來不是很難,規則如下:

代碼示例:

{dede:trim}要過濾的內容{/dede:trim}

如果要過濾的內容很簡單,完全可以把過濾規則直接寫在“{dede:trim}”和“{/dede:trim}”之間。

對于比較復雜的情況,請考慮使用正則,你懂的,正則表達式,那是相當強勁的。

以下是一些過濾規則的例子,供大家參考。

1、采集中去除內容里的超鏈接:

代碼示例:

{dede:trim}<a([^>]*)>{/dede:trim}{dede:trim}</a>{/dede:trim}

假如要將所有超鏈接內容都去除,規則是:

代碼示例:

{dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}

這兩個規則的不同通過下面代碼來解釋

例如文章代碼中包含著如下內容:

<a href="#">超鏈接</a>

通過第一個規則,采集結果是:超鏈接

2、過濾廣告

對于廣告來說,過濾規則就得針對html中看到的內容使用規則了,例如某些廣告僅僅是引用某個JS文件,例如

代碼示例:

<script src=’/plus/ad_js.php?aid=4′ language=’javascript’></script>

這樣的規則只需

代碼示例:

{dede:trim}<script(.*)>{/dede:trim}{dede:trim}</script>{/dede:trim}

如果某些廣告的內容是JS代碼寫在<script></script>區間里的,例如GG的廣告,那么過濾規則應該是:

代碼示例:

{dede:trim}<script>(.*)</script>{/dede:trim}

3、一些測試過的過濾規則

代碼示例:

{dede:trim}<!–(.*)–>{/dede:trim}{dede:trim}<select([^>]*)>([^>]*)</select>{/dede:trim}{dede:trim}<option([^>]*)>([^>]*)</option>{/dede:trim}{dede:trim}<select([^>]*)>{/dede:trim}{dede:trim}</select>{/dede:trim}{dede:trim}<param([^>]*)>{/dede:trim}{dede:trim}<embed([^>]*)>([^>]*)</embed>{/dede:trim}{dede:trim}<embed([^>]*)>{/dede:trim}{dede:trim}</embed>{/dede:trim}{dede:trim}<object([^>]*)>([^>]*)</object>{/dede:trim}{dede:trim}<object([^>]*)>{/dede:trim}{dede:trim}</object>{/dede:trim}{dede:trim}<OBJECT([^>]*)>([^>]*)</OBJECT>{/dede:trim}{dede:trim}<OBJECT([^>]*)>{/dede:trim}{dede:trim}</OBJECT>{/dede:trim}{dede:trim}<iframe([^>]*)>([^>]*)</iframe>{/dede:trim}{dede:trim}<iframe([^>]*)>{/dede:trim}//by www.survivalescaperooms.com//{dede:trim}</iframe>{/dede:trim}{dede:trim}<IFRAME([^>]*)>([^>]*)</IFRAME>{/dede:trim}{dede:trim}<IFRAME([^>]*)>{/dede:trim}{dede:trim}</IFRAME>{/dede:trim}{dede:trim}<font([^>]*)>([^<]*)</font>{/dede:trim}{dede:trim}<font([^>]*)>{/dede:trim}{dede:trim}</font>{/dede:trim}{dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}{dede:trim}<a([^>]*)>{/dede:trim}{dede:trim}</a>{/dede:trim}{dede:trim}<td([^>]*)>([^>]*)</td>{/dede:trim}{dede:trim}<td([^>]*)>{/dede:trim}{dede:trim}</td>{/dede:trim}{dede:trim}<tr([^>]*)>([^>]*)</tr>{/dede:trim}{dede:trim}<tr([^>]*)>{/dede:trim}{dede:trim}</tr>{/dede:trim}{dede:trim}<tbody([^>]*)>([^>]*)</tbody>{/dede:trim}{dede:trim}<tbody>{/dede:trim}{dede:trim}</tbody>{/dede:trim} // 內容來自www.survivalescaperooms.com//{dede:trim}<table([^>]*)>([^>]*)</table>{/dede:trim}{dede:trim}<table([^>]*)>{/dede:trim}{dede:trim}</table>{/dede:trim}{dede:trim}<span([^>]*)>{/dede:trim}{dede:trim}</span>{/dede:trim}{dede:trim}</IFRAME>{/dede:trim}{dede:trim}<script>(.*)</script>{/dede:trim}{dede:trim}<script(.*)>{/dede:trim}{dede:trim}</script>{/dede:trim}
以上就是織夢dedecms采集中用到的一些過濾規則的全部內容,希望對大家的學習和解決疑問有所幫助,也希望大家多多支持武林網。
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 双辽市| 普宁市| 尼木县| 昭苏县| 禄劝| 磐安县| 上杭县| 沙田区| 呼伦贝尔市| 太保市| 涿鹿县| 都兰县| 宁远县| 宜兰县| 三台县| 五原县| 维西| 南康市| 台东市| 合肥市| 金昌市| 通榆县| 饶平县| 天柱县| 青海省| 郴州市| 东乡族自治县| 修武县| 万盛区| 宝兴县| 琼结县| 丽江市| 镇雄县| 虞城县| 蒙阴县| 垣曲县| 南宁市| 广河县| 临邑县| 贺州市| 噶尔县|