国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 學院 > 編程設計 > 正文

爬蟲技術之分布式爬蟲架構的講解

2020-03-17 12:19:18
字體:
來源:轉載
供稿:網友

分布式爬蟲架構并不是一開始就出現的。而是一個逐步演化的過程。

最開始入手寫爬蟲的時候,我們一般在個人計算機上完成爬蟲的入門和開發,而在真實的生產環境,就不能用個人計算機來運行爬蟲程序了,而是將爬蟲程序部署在服務器上。利用服務器不關機的特性,爬蟲可以不間斷的24小時運行。單機爬蟲的結構如下圖。

爬蟲技術,分布式,爬蟲架構

然而,由于爬蟲在爬取數據時,爬取頻次并不能太快,即使是爬蟲在服務器上不間斷運行,效率可能也無法滿足實際需求。這時候,就需要在多機上部署爬蟲程序,用分布式爬蟲架構,進行數據爬取。分布式爬蟲的架構一般如下所示。

爬蟲技術,分布式,爬蟲架構

采用分布式爬蟲架構后,帶來了如下幾個好處。

  • 1,爬蟲效率提高。這一點顯而易見,之前是單機運行,現在是多機分布式運行,效率顯著提高。
  • 2,爬蟲可靠性可用性提高。之前部署在一臺服務器上,當服務器出現故障或爬蟲程序出現故障時,爬蟲便不可用了。采用分布式爬蟲架構后,爬蟲任務生產者,任務隊列,爬蟲任務消費者都采用分布式架構部署,其中的某些機器出現故障,不影響整體的可用性,系統可靠性大大增強。

總結

以上就是這篇文章的全部內容了,希望本文的內容對大家的學習或者工作具有一定的參考學習價值,謝謝大家對VEVB武林網的支持。


注:相關教程知識閱讀請移步到Redis頻道。
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 五台县| 东源县| 外汇| 剑川县| 滁州市| 乌鲁木齐市| 科技| 宿州市| 广元市| 东至县| 叶城县| 孟连| 喀喇沁旗| 渭源县| 大理市| 垦利县| 三都| 潮安县| 康乐县| 东海县| 崇信县| 云浮市| 泽普县| 秀山| 永吉县| 南丰县| 兰州市| 繁昌县| 柳州市| 萨嘎县| 雷波县| 丹江口市| 南充市| 亳州市| 丹东市| 怀集县| 乐东| 台湾省| 吉首市| 横山县| 怀安县|