本文實例講述了python使用正則表達式提取網頁URL的方法。分享給大家供大家參考。具體實現方法如下:
import reimport urlliburl="http://www.jb51.net"s=urllib.urlopen(url).read()ss=s.replace(" ","")urls=re.findall(r"<a.*?href=.*?<//a>",ss,re.I)for i in urls: print ielse: print 'this is over'
PS:這里再為大家提供2款非常方便的正則表達式工具供大家參考使用:
JavaScript正則表達式在線測試工具:
http://tools.jb51.net/regex/javascript
正則表達式在線生成工具:
http://tools.jb51.net/regex/create_reg
希望本文所述對大家的Python程序設計有所幫助。
新聞熱點
疑難解答