国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > ASP > 正文

雨哲防采集策略之列表篇

2024-05-04 10:57:29
字體:
來源:轉載
供稿:網友
在一般的鏈接地址形式如:  
復制代碼 代碼如下:

1、<a class="鏈接樣式" href="鏈接地址" title="鏈接說明" target="_blank">文章標題</a>  
2、<a class='鏈接樣式' href='鏈接地址' title='鏈接說明' target='_blank'>文章標題</a>  

       大家注意看上面兩行代碼,有一個區別就是第一個中間使用的是雙引號,第二個使用的是單引號。一般來說,如果在文章列表頁面都使用雙引號或者使用單引號,很容易讓采集者找到文章路徑(開始代碼:href=' ,結束代碼:' )。 

      那如果我們混合著用,也就是有的使用單引號,有的使用雙引號,那么就會給采集者帶來一定的麻煩。至少他不能采集到所有文章(如果采集程序差一點的話可能一篇也采集不到)。 

在上面的基礎上,更深入一步將A中間的參數進行隨機排列:  
復制代碼 代碼如下:

<a href="鏈接地址" title="鏈接說明" target="_blank" class="鏈接樣式">  
<a href="鏈接地址" class="鏈接樣式" title="鏈接說明" target="_blank">  
<a title="鏈接說明" href="鏈接地址" class="鏈接樣式" target="_blank">  
       然后再在其中混用單雙引號,在href=后面還可以不使用引號。那么采集者將不能正確獲取列表頁面中文章地址。 

       再深入一步,可以在列表中加入干擾碼,如把鏈接部分重復加一次空白鏈接,(<a href="鏈接地址" title="鏈接說明" target="_blank" class="鏈接樣式"></a>),那么如果對方能夠獲取一部分文章地址,或者能夠采集一部分文章,那么這部分文章也肯定是重復的。 

在進行以上修改后,我想大部分采集者都會知難退的哈。缺點就是代碼不太標準。以上僅雨哲個人觀點。 
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 贡觉县| 鄂托克旗| 博客| 同德县| 阆中市| 缙云县| 孟津县| 清苑县| 东宁县| 浦江县| 城步| 周宁县| 甘孜县| 保德县| 凭祥市| 寻甸| 台安县| 崇义县| 上犹县| 金坛市| 蓝山县| 儋州市| 陆良县| 德昌县| 新源县| 聂荣县| 玉溪市| 辽宁省| 桓仁| 铅山县| 观塘区| 通许县| 呼图壁县| 遂溪县| 娱乐| 新民市| 乌苏市| 南部县| 灌云县| 阿瓦提县| 腾冲县|