国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 網站 > 優化推廣 > 正文

網絡蜘蛛:深度優先還是廣度優先

2024-04-26 13:42:19
字體:
來源:轉載
供稿:網友

"網絡蜘蛛" 學名Spider,又叫"網絡爬蟲"! 關于網絡蜘蛛的概述這里就不多講了,今天我主要想說的是關于蜘蛛的爬行設計的方式與方法。

我們可以分為2種:

那么什么是深度優先? 什么是廣度優先?有什么用? 上海SEO (SWJ) 下面為大家講解!本人學知淺薄只會用通俗的話與道理與大家分析,如有錯誤請及時聯系我 所以還請大家多多見諒包含!

一種是深度優先策略,一種是廣度優先策略! 以下我們就圍繞這2點進行分析SWJ非常歡迎大家一起交流、學習與探討!

深度優先顧名思義就是讓網絡蜘蛛盡量的在抓取網頁時往網頁更深層次的挖掘進去 講究的是深度!也泛指: 網絡蜘蛛將會從起始頁開始,一個鏈接一個鏈接跟蹤下去,處理完這條線路之后再轉入下一個起始頁,繼續跟蹤鏈接!

以下我發張圖 大家看下: (下面這張是 簡單化的網頁連接模型圖 其中A為起點 也就是蜘蛛索引的起點!)

總共分了5條路徑 供蜘蛛爬行! 講究的是深度!

點此在新窗口中查看原始圖片

(下面這張是 經過優化的網頁連接模型圖! 也就是改進過的蜘蛛深度爬行策略圖!)

點此在新窗口中查看原始圖片

根據以上2個表格 我們可以得出以下結論:

圖1:路徑1 ==> A --> B --> E --> H 路徑2 ==> A --> B --> E --> i

路徑3 ==> A --> C 路徑4 ==> A --> D --> F --> K --> L

路徑5 ==> A --> D --> G --> K --> L

經過優化后

圖2: (圖片已經幫大家標上方向了!)

路徑1 ==> A --> B --> E --> H 路徑2 ==> i

路徑3 ==> C 路徑4 ==> D --> F --> K --> L 路徑5 ==> G

深度爬行的優點是:網絡蜘蛛程序在設計的時候相對比較輕易些把 其他我也沒發覺有什么優點... 還有就是 蜘蛛的這種 "勇往直前"的精神 值得學習下! ^_^

深度爬行的缺點是:缺點么多了一點點 呵呵! 每次爬行一層總要向"蜘蛛老家" 數據庫訪問一下。問問老總有必要還要爬下一層嗎! 爬一層 問一次.... 引用一句高人的話 假如一個蜘蛛不管3721不斷往下爬 很可能迷路更有可能爬到國外的網站去.. 本來目標是中文網站 因為IP的問題 國外IP做了中文站的話.... 就輕易去別人"老家"了..這樣不僅增加了系統數據的復雜度更是增加的服務器的負擔 我想沒有一家搜索公司會愿意則樣的把,...除非腦子"秀"了 .. ^_^

接下來 我們介紹下普遍使用的 廣度優先策略 大家休息下 喝杯咖啡 看的也累把 我寫的也累.... ^^

廣度優先在這里的定義就是層爬行。什么叫蜘蛛層爬行?就是一層一層的爬行 按照層的分布與布局 去索引處理與抓取網頁! 當然SE不會派一個蜘蛛去的 每層會派一個或多個蜘蛛Spider去抓取內容!

共2頁上一頁12下一頁
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 新田县| 米脂县| 金平| 岚皋县| 兴宁市| 长葛市| 游戏| 石泉县| 济源市| 兴国县| 黄大仙区| 黄龙县| 富锦市| 美姑县| 临猗县| 全椒县| 高安市| 临沭县| 卫辉市| 砀山县| 桑日县| 门头沟区| 沿河| 雅江县| 浦东新区| 沽源县| 清丰县| 宣汉县| 长子县| 海口市| 新营市| 双鸭山市| 澄迈县| 巍山| 岢岚县| 建昌县| 盈江县| 密云县| 井冈山市| 北流市| 类乌齐县|