網站相關:
1、builtwith模塊,第三方模塊,可以用pip直接安裝。作用:返回網站所用前后端框架,后臺語言,服務器 操作系統,等網站信息。
2、whois模塊,第三方模塊,可以pip安裝。作用:返回域名的所有者,email,注冊地址等等whois信息。
3、urllib、urllib2、request模塊,標準庫。作用:與網站服務器進行訪問、回饋等交互操作。
4、urlparse模塊,標準庫,作用:對網址字符串進行解析、分割、組裝等操作。
內容提取:
1、re模塊,標準庫,純C編寫,效率高。作用:用正則表達式方式提取信息。
2、beautiful模塊,第三方模塊,作用:提取網頁標簽方面作用強大而簡單,比正則提取網頁靈活。
3、lxml模塊,第三方模塊,作用與beautifulsoup一致,簡潔強大,支持xpath、find和CSS選擇器等方式定 位元素,c語言寫的,安裝麻煩,效率高。
4、json模塊,作用解析json格式的內容。
系統方面:
1、os模塊,標準庫
2、sys模塊,標準庫
未分類:
1、itertools
2、datetime
3、random
4、time
5、pyaotogui(模擬鍵鼠,類似按鍵精靈)
新聞熱點
疑難解答