国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

Python中正則表達式小結

2020-02-15 23:06:05
字體:
來源:轉載
供稿:網友

注意:本文基于Python2.4完成;如果看到不明白的詞匯請記得百度谷歌或維基,whatever。

1. 正則表達式基礎

1.1. 簡單介紹

正則表達式并不是Python的一部分。正則表達式是用于處理字符串的強大工具,擁有自己獨特的語法以及一個獨立的處理引擎,效率上可能不如str自帶的方法,但功能十分強大。得益于這一點,在提供了正則表達式的語言里,正則表達式的語法都是一樣的,區別只在于不同的編程語言實現支持的語法數量不同;但不用擔心,不被支持的語法通常是不常用的部分。如果已經在其他語言里使用過正則表達式,只需要簡單看一看就可以上手了。

下圖展示了使用正則表達式進行匹配的流程:

正則表達式的大致匹配過程是:依次拿出表達式和文本中的字符比較,如果每一個字符都能匹配,則匹配成功;一旦有匹配不成功的字符則匹配失敗。如果表達式中有量詞或邊界,這個過程會稍微有一些不同,但也是很好理解的,看下圖中的示例以及自己多使用幾次就能明白。

下圖列出了Python支持的正則表達式元字符和語法:  

1.2. 數量詞的貪婪模式與非貪婪模式

正則表達式通常用于在文本中查找匹配的字符串。Python里數量詞默認是貪婪的(在少數語言里也可能是默認非貪婪),總是嘗試匹配盡可能多的字符;非貪婪的則相反,總是嘗試匹配盡可能少的字符。例如:正則表達式"ab*"如果用于查找"abbbc",將找到"abbb"。而如果使用非貪婪的數量詞"ab*?",將找到"a"。

1.3. 反斜杠的困擾

與大多數編程語言相同,正則表達式里使用"/"作為轉義字符,這就可能造成反斜杠困擾。假如你需要匹配文本中的字符"/",那么使用編程語言表示的正則表達式里將需要4個反斜杠"http:////":前兩個和后兩個分別用于在編程語言里轉義成反斜杠,轉換成兩個反斜杠后再在正則表達式里轉義成一個反斜杠。Python里的原生字符串很好地解決了這個問題,這個例子中的正則表達式可以使用r"http://"表示。同樣,匹配一個數字的"http://d"可以寫成r"/d"。有了原生字符串,你再也不用擔心是不是漏寫了反斜杠,寫出來的表達式也更直觀。

1.4. 匹配模式

正則表達式提供了一些可用的匹配模式,比如忽略大小寫、多行匹配等,這部分內容將在Pattern類的工廠方法re.compile(pattern[, flags])中一起介紹。

2. re模塊

2.1. 開始使用re

Python通過re模塊提供對正則表達式的支持。使用re的一般步驟是先將正則表達式的字符串形式編譯為Pattern實例,然后使用Pattern實例處理文本并獲得匹配結果(一個Match實例),最后使用Match實例獲得信息,進行其他的操作。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 凤阳县| 个旧市| 上思县| 乡宁县| 大庆市| 白城市| 丹凤县| 兰溪市| 洪雅县| 广饶县| 从化市| 鄂温| 佛教| 博乐市| 江口县| 荣昌县| 营山县| 洱源县| 福州市| 凤台县| 岐山县| 沈丘县| 桦甸市| 布拖县| 湘西| 友谊县| 丁青县| 平定县| 厦门市| 明光市| 阿荣旗| 盖州市| 铁岭县| 霍城县| 壤塘县| 宁化县| 五莲县| 易门县| 策勒县| 衡水市| 东至县|