国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > CMS > 織夢DEDE > 正文

織夢CMS后臺采集過濾規則 萬能采集過濾代碼 常用過濾

2024-07-12 08:50:23
字體:
來源:轉載
供稿:網友
這篇文章主要為大家詳細介紹了織夢CMS后臺采集過濾規則 萬能采集過濾代碼 常用過濾,具有一定的參考價值,感興趣的小伙伴們可以參考一下,有需要的朋友可以收藏方便以后借鑒。

      很多朋友在初始建站的時候會選擇織夢的采集功能,說實話織夢dedecms自帶的采集系統確實很不錯,可以免去一些手工添加信息的麻煩,設置一下dede采集規則、采集點,然后點采集,很容易就會有幾百篇文章!

織夢CMS后臺采集過濾規則 萬能采集過濾代碼 常用過濾

下面武林網介紹幾種常用采集規則的過濾方法:

應用示例一:dedecms過濾標題空格

經常在采集文章的時候,標題文字里面有空格,采回來后應用很是麻煩,所以需要在標題處過濾處添加下面正則過濾

{dede:trim} {/dede:trim}

注意:中間是有一個空格

應用示例二:來源作者中連接的過濾

在采集文章的時候,有的網站系統里面作者或者來源處都帶有連接,直接采集的話將連接采集回來了,然后由于這兩個字段有限制,通常會造成需要采集的內容沒有采集回來,所以需要在過濾處添加下面正則過濾。

1,如果要保留dedecms鏈接中的文字:

{dede:trim}<a([^>]*)>{/dede:trim}{dede:trim}</a>{/dede:trim}

2,如果去掉鏈接中的文字:

{dede:trim}<a ([^>]*)>([^<]*)</a>{/dede:trim}

應用示例三:文章內容中連接以及其他廣告代碼的過濾

這個就不用說了,當需要對所有東西過濾的時候,直接用上面所有的代碼過濾就可以,但是實際應用中,我們只需要對連接、動畫、調用等進行過濾。(這個需要按照對方內容里面具體含有什么代碼來具體操作)

一般的只有鏈接,使用二中的代碼進行過濾就可以了,但是實際上一般的網站現在都在內容里面加有廣告等,所以采取下面的過濾正則就可以完成過濾:

{dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}{dede:trim}<IFRAME([^>]*)>([^>]*)</IFRAME>{/dede:trim}{dede:trim}<object([^>]*)>([^>]*)</object>{/dede:trim}{dede:trim}<script([^>]*)>([^>]*)</script>{/dede:trim}

過濾div可以用

{dede:trim}]*)>{/dede:trim}{dede:trim}{/dede:trim}

過濾js用下面這個

{dede:trim}]*)>([^<]*){/dede:trim}

過濾未知變量字符

固定(.*)固定

應用示例四:過濾GG廣告代碼

其實這個就是在上面的內容過濾,但是很多論壇里的網友經常問這個,所以單獨作為一個應用列出來:

{dede:trim}<script([^>]*)>([^>]*)</script>{/dede:trim}

下面是在綜合論壇上網友的各種正則的一個dedecms規則過濾全集:

{dede:trim}<param([^>]*)>{/dede:trim}{dede:trim}<embed([^>]*)>([^>]*)</embed>{/dede:trim}{dede:trim}<embed([^>]*)>{/dede:trim}{dede:trim}</embed>{/dede:trim}{dede:trim}<object([^>]*)>([^>]*)</object>{/dede:trim}{dede:trim}<object([^>]*)>{/dede:trim}{dede:trim}</object>{/dede:trim}{dede:trim}<OBJECT([^>]*)>([^>]*)</OBJECT>{/dede:trim}{dede:trim}<OBJECT([^>]*)>{/dede:trim}{dede:trim}</OBJECT>{/dede:trim}{dede:trim}<iframe([^>]*)>([^>]*)</iframe>{/dede:trim}{dede:trim}<iframe([^>]*)>{/dede:trim}{dede:trim}</iframe>{/dede:trim}{dede:trim}<IFRAME([^>]*)>([^>]*)</IFRAME>{/dede:trim}{dede:trim}<IFRAME([^>]*)>{/dede:trim}{dede:trim}</IFRAME>{/dede:trim}{dede:trim}<font([^>]*)>([^<]*)</font>{/dede:trim}{dede:trim}<font([^>]*)>{/dede:trim}{dede:trim}</font>{/dede:trim}{dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}{dede:trim}<a([^>]*)>{/dede:trim}{dede:trim}</a>{/dede:trim}{dede:trim}<td([^>]*)>([^>]*)</td>{/dede:trim}{dede:trim}<td([^>]*)>{/dede:trim}{dede:trim}</td>{/dede:trim}{dede:trim}<tr([^>]*)>([^>]*)</tr>{/dede:trim}{dede:trim}<tr([^>]*)>{/dede:trim}{dede:trim}</tr>{/dede:trim}{dede:trim}<tbody([^>]*)>([^>]*)</tbody>{/dede:trim}{dede:trim}<tbody>{/dede:trim}{dede:trim}</tbody>{/dede:trim}{dede:trim}<table([^>]*)>([^>]*)</table>{/dede:trim}{dede:trim}<table([^>]*)>{/dede:trim}{dede:trim}</table>{/dede:trim}{dede:trim}<img([^>]*)>{/dede:trim}{dede:trim}<span([^>]*)>{/dede:trim}{dede:trim}</span>{/dede:trim}{dede:trim} {/dede:trim}{dede:trim}<stong>{/dede:trim}{dede:trim}</stong>{/dede:trim}

好了,上面四種應用基本上涵蓋了采集的各種應用,掌握了這個,過濾基本上就不用求人了!下面教大家一個更簡單的方法,把下面的過濾規則復制到你那里去,幾乎就可以處理所有的問題了,當然也可以自己分析一下。

{dede:trim}<span(.*)>{/dede:trim}{dede:trim}</span>{/dede:trim}{dede:trim}<div(.*)>{/dede:trim}{dede:trim}</div>{/dede:trim}{dede:trim}<li>{/dede:trim}{dede:trim}</li>{/dede:trim}{dede:trim}<ul>{/dede:trim}{dede:trim}</ul>{/dede:trim}{dede:trim}<font(.*)>{/dede:trim}{dede:trim}</font>{/dede:trim}{dede:trim}<table(.*)>{/dede:trim}{dede:trim}</table>{/dede:trim}{dede:trim}<tbody(.*)>{/dede:trim}{dede:trim}</tbody>{/dede:trim}{dede:trim}<tr(.*)>{/dede:trim}{dede:trim}</tr>{/dede:trim}{dede:trim}<td(.*)>{/dede:trim}{dede:trim}</td>{/dede:trim}{dede:trim}<a(.*)>{/dede:trim}{dede:trim}</a>{/dede:trim}{dede:trim}<iframe(.*)</iframe>{/dede:trim}{dede:trim}<style(.*)</style>{/dede:trim}{dede:trim}<script(.*)</script>{/dede:trim}{dede:trim}<option(.*)</option>{/dede:trim}{dede:trim}<select(.*)</select>{/dede:trim}{dede:trim}<embed(.*)>{/dede:trim}{dede:trim}</embed>{/dede:trim}{dede:trim}<param(.*)</param>{/dede:trim}{dede:trim}<object(.*)</object>{/dede:trim}

上面這一段萬能采集過濾代碼,不能用來采集帶有視頻的頁面,因為已經過濾了視頻,最后的四行是過濾掉視頻的。如果你確認要采集視頻,那就去掉最后四行。

以上就是織夢CMS后臺采集過濾規則 萬能采集過濾代碼 常用過濾的全部內容,希望對大家的學習和解決疑問有所幫助,也希望大家多多支持武林網。
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 手机| 龙口市| 昌江| 成安县| 洮南市| 正宁县| 依安县| 文昌市| 莆田市| 昭平县| 自贡市| 华坪县| 射洪县| 老河口市| 镇原县| 莱西市| 巨鹿县| 孙吴县| 呼图壁县| 汕尾市| 且末县| 金乡县| 蓬莱市| 炎陵县| 化州市| 延津县| 长宁县| 巴林右旗| 当涂县| 西华县| 高安市| 阜宁县| 新余市| 柘荣县| 甘南县| 阿瓦提县| 丁青县| 民丰县| 阳曲县| 瓦房店市| 淅川县|