国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 網(wǎng)站 > 建站經(jīng)驗(yàn) > 正文

解析織夢v5.3的分頁采集

2024-04-25 20:26:25
字體:
供稿:網(wǎng)友

最近想做個(gè)技術(shù)型的網(wǎng)站,不知道用什么cms來做,在網(wǎng)上搜索了一大堆,看到織夢的采集功能還不錯,我也在想啊,做一個(gè)站如果所有的文章都需要站長一個(gè)一個(gè)的加,那不是要累死啊,所以就選著了織夢。

還好自己有點(diǎn)基礎(chǔ),弄了一天就基本弄懂織夢的操作流程了,申請域名、空間,上傳程序。忙得是不亦樂乎,好了,開始采集文章了。好高興,一下就有了2000多篇文章。高興的打開來瞧瞧,哇,突然嚇了一跳,發(fā)現(xiàn)一個(gè)文章一看就只有一段沒有完整,打開源原址一看,原來有分頁,在網(wǎng)上找了N久,還是沒有結(jié)果,自己摸索摸索吧,搞了一天一夜幾乎沒有睡覺,我差點(diǎn)都沒有信心了,想著就是采集的文章只有一半,別人怎么看啊,都不想做了,也累了,還是好好睡一覺吧。

也許是老天看我太辛苦了吧,剛想睡覺,突然我一下睡意全無,我太興奮了,我看到了,看到了分頁被我采集了。好了,說了這么多,還是開始進(jìn)入正題了。直接看圖。如果看不懂請打開源網(wǎng)址,查看源文件,和我的教程比較。開始選著左邊的采集,然后打開采集節(jié)點(diǎn)管理,添加新節(jié)點(diǎn),選著普通文章。1、 文章列表頁采集節(jié)點(diǎn)名稱:自己根據(jù)你的網(wǎng)站目錄和采集內(nèi)容結(jié)合起來。網(wǎng)址:http://webdesign.chinaitlab.com/List_1399_(*).html 是有規(guī)則的網(wǎng)址列表。  如果有不規(guī)則追加就好了。http://webdesign.chinaitlab.com/List_1399.html如果只有一頁或幾頁沒有規(guī)則就直接寫在下面手工指定網(wǎng)址就好了。  

文章列表匹配規(guī)則。注意要多看幾頁找出相同的,列表頁大體相同,但有些有點(diǎn)小變化,所以要找出幾頁的共同html代碼。

區(qū)域開始的html :

以下為引用的內(nèi)容:
<TBODY>                  <TR>                     <TD width="74%" height="796" align=left vAlign=top><BR>                      <table cellSpacing=0 cellPadding=0 width=490 align=center border=0>                                                 <tr> 區(qū)域結(jié)束的html :</tr>                                                 <tr>                           <td class=zhi12 colSpan=2><BR>

建議寫上篩選,一般寫必須包含,這樣準(zhǔn)確點(diǎn):chinaitlab.com/flashsl

保存進(jìn)入下一步設(shè)置。以看到下面的圖為準(zhǔn)。

3、 分頁設(shè)置預(yù)覽網(wǎng)址可以更改。選擇有分頁的頁面來預(yù)覽,當(dāng)然最好多預(yù)覽幾頁,主要是和前面一樣代碼可能有小變化,選著相同的html代碼http://webdesign.chinaitlab.com/flashsl/775579.html分頁匹配規(guī)則這里只要做過一次就不難了。

看我的代碼 ,請和源網(wǎng)址,查看源文件對比。

以下為引用的內(nèi)容:
<p align='center'><b><font color='red'>[內(nèi)容]</b></p><div align=right style="margin:3px 0;">[內(nèi)容]為我們需要的內(nèi)容,這個(gè)我想大家都知道了同理做好文章標(biāo)題:(標(biāo)題有兩個(gè)地方有,當(dāng)然選簡單的個(gè))<B class=zhi25><FONT color=#003399><BR><BR></FONT></B><B class=zhi25><FONT color=#003399>[內(nèi)容]</FONT></B><br>文章作者:<IMG height=11 src="http://www.chinaitlab.com/cms/images/Author.gif" _fcksavedurl=""http://www.chinaitlab.com/cms/images/Author.gif"" width=11>[內(nèi)容]<IMG height=15 src="http://webdesign.chinaitlab.com/images/c3.gif" width=14>

 文章來源:<IMG height=12 src="http://webdesign.chinaitlab.com/images/c1.gif" _fcksavedurl=""http://webdesign.chinaitlab.com/images/c1.gif"" width=17>[內(nèi)容]<IMG height=12 src="http://webdesign.chinaitlab.com/images/c2.gif" width=12>

這里有一個(gè)<a >中國教程網(wǎng)</a>(但是在我測試的有些里面又沒有,就是直接就是如   中國教程網(wǎng) )所以有些就采集不出來,我只有寫遠(yuǎn)點(diǎn)所以需要一個(gè)過濾規(guī)則,就是去掉不要的。規(guī)則是在需要的時(shí)候才有用,沒有<a></a>的時(shí)候就沒有用。下面的代碼就是去掉<a> </a>標(biāo)簽保留中間內(nèi)容。

你可以直接點(diǎn)擊常用規(guī)則選著超鏈接看哈有什么區(qū)別。

以下為引用的內(nèi)容:
{dede:trim replace=""}<a([^>]*)>{/dede:trim}{dede:trim replace=""}</a>{/dede:trim}  文章內(nèi)容:進(jìn)入網(wǎng)絡(luò)咨詢平臺</strong></a> <strong><span class="style1"> ◆</span></strong><br>                                       <BR class=zhi14>[內(nèi)容]<span style="border:1px dashed #cccccc; margin:3px;"> 

同樣的需要過濾規(guī)則,你可以先不寫規(guī)則看哈,有什么區(qū)別就知道規(guī)則有什么用了。規(guī)則一定要根據(jù)實(shí)際文章來寫。

以下為引用的內(nèi)容:
{dede:trim replace=""}<style([^>]*)>(.*)</style>{/dede:trim}{dede:trim replace=""}<div([^>]*)>{/dede:trim}{dede:trim replace=""}</div>{/dede:trim}{dede:trim replace=""}<SPAN([^>]*)>{/dede:trim}{dede:trim replace=""}</SPAN>{/dede:trim}{dede:trim replace=""}<a([^>]*)>{/dede:trim}{dede:trim replace=""}</a>{/dede:trim}{dede:trim replace=""}</p><p align='center'><b>(.*)</b></p>{/dede:trim}

這一句我多說哈,主要作用是去掉后面的分頁的文字。我開始也考慮把分頁內(nèi)容排除在文章內(nèi)容外面,但是有些文章又沒有分頁代碼,所以在文章的結(jié)尾html不好寫,所以我寫遠(yuǎn)點(diǎn)然后用規(guī)則去掉分頁文字 (同樣的如果不懂先不加這條,比較哈就知道了)

{dede:trim replace=""}<font([^>]*)>{/dede:trim}{dede:trim replace=""}</font>{/dede:trim}分頁采集成功沒有可以看有沒有一個(gè){副標(biāo)題#e#},還有看哈最后一頁采集到?jīng)]有就知道。 

中間也有

發(fā)表評論 共有條評論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 怀柔区| 塘沽区| 蛟河市| 恩施市| 迭部县| 屯昌县| 嵊州市| 扶风县| 蒲城县| 永兴县| 兰坪| 济南市| 大竹县| 莫力| 绥棱县| 霞浦县| 敖汉旗| 白银市| 于田县| 仁布县| 正安县| 光泽县| 景泰县| 长泰县| 兴海县| 沾益县| 赤城县| 黎城县| 罗定市| 当阳市| 汝城县| 慈利县| 平江县| 沅江市| 永兴县| 牟定县| 互助| 湘潭市| 陈巴尔虎旗| 东平县| 临桂县|