国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

Python爬蟲包BeautifulSoup異常處理(二)

2020-02-15 21:53:38
字體:
來源:轉載
供稿:網(wǎng)友

面對網(wǎng)絡不穩(wěn)定,頁面更新等問題,很可能出現(xiàn)程序異常的問題,所以我們要對程序進行一些異常處理。大家可能覺得處理異常是一個比較麻煩的活,但在面對復雜網(wǎng)頁和任務的時候,無疑成為一個很好的代碼習慣。

網(wǎng)頁‘404'、‘500'等問題

try:    html = urlopen('http://www.pmcaff.com/2221')  except HTTPError as e:    print(e)

返回的是空網(wǎng)頁

if html is None:    print('沒有找到網(wǎng)頁')

目標標簽在網(wǎng)頁中缺失

try:    #不存在的標簽    content = bsObj.nonExistingTag.anotherTag   except AttributeError as e:    print('沒有找到你想要的標簽')  else:    if content == None:      print('沒有找到你想要的標簽')    else:      print(content)

實例

if sys.version_info[0] == 2:  from urllib2 import urlopen # Python 2  from urllib2 import HTTPErrorelse:  from urllib.request import urlopen # Python3  from urllib.error import HTTPErrorfrom bs4 import BeautifulSoupimport sysdef getTitle(url):  try:    html = urlopen(url)  except HTTPError as e:    print(e)    return None  try:    bsObj = BeautifulSoup(html.read())    title = bsObj.body.h1  except AttributeError as e:    return None  return titletitle = getTitle("http://www.pythonscraping.com/exercises/exercise1.html")if title == None:  print("Title could not be found")else:  print(title)

以上全部為本篇文章的全部內容,希望對大家的學習有所幫助,也希望大家多多支持武林站長站。

發(fā)表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發(fā)表
主站蜘蛛池模板: 广安市| 平阴县| 中牟县| 周至县| 江陵县| 汨罗市| 连平县| 会泽县| 长乐市| 泗阳县| 额敏县| 黔西县| 克拉玛依市| 阿荣旗| 揭西县| 东丰县| 宁津县| 余江县| 土默特右旗| 安乡县| 兴化市| 涟源市| 库伦旗| 义马市| 朝阳县| 普格县| 涿州市| 沾化县| 临邑县| 德化县| 苍南县| 东平县| 石首市| 揭东县| 铜山县| 搜索| 南康市| 邵阳县| 昂仁县| 灯塔市| 南昌市|