python 正則表達(dá)式學(xué)習(xí)小結(jié)

2020-03-22 20:24:31

字體：大中小

供稿：網(wǎng)友

在Python中實(shí)現(xiàn)正則的方式是通過(guò)re（regular expression的縮寫(xiě)）模塊來(lái)實(shí)現(xiàn)的，你可以調(diào)用re模塊的各種方法來(lái)實(shí)現(xiàn)不同的功能，下面我們就來(lái)說(shuō)下，在Python中通過(guò)re模塊可以調(diào)用那些方法，以及這些方法的作用都是什么；還有就是正則的實(shí)例以及各種特殊符號(hào)的含義：
1、re.sub和replace:
sub的全拼是substitute，也就是替換的意思；既然知道是替換了，那就很容易用到實(shí)例中了，其實(shí)replace也是替換的意思，只不過(guò)它們的用法不太相同，下面用一個(gè)例子來(lái)詳細(xì)說(shuō)明下它們的異同之處：
import re str1 = 'Hello 111 is 222' str2 = str1.replace('111','222') print(str2)Hello 222 is 222 這是一個(gè)簡(jiǎn)單的例子，如果是下面這種情形，把所有的數(shù)字都換成222，那么用replace實(shí)現(xiàn)起來(lái)就比較麻煩，而用re模塊的sub方法實(shí)現(xiàn)起來(lái)就比較的簡(jiǎn)單：（如果是更復(fù)雜的操作，使用replace可能就無(wú)法實(shí)現(xiàn)了。）
import re str1 = 'Hello 123 is 456' str2 = re.sub('/d+','222',str1) print(str2)Hello 222 is 222 2、re.search()和re.match():
match: 只從字符串的開(kāi)始與html' target='_blank'>正則表達(dá)式匹配，匹配成功返回matchobject,否則返回none.
search:將字符串的所有字串嘗試與正則表達(dá)式匹配，如果所有的字串都沒(méi)有匹配成功則返回none，否則返回matchobject.
下面這個(gè)例子說(shuō)明了match和search的異同點(diǎn)，也說(shuō)明了，在實(shí)際的應(yīng)用中，search用的還是比較多的：
import restr = 'helloword,i am alex'if not re.match('word',str):print('cannot match')print(re.match('hello',str1).group())print(re.search('word',str1).group())#顯示結(jié)果cannot matchhelloword 3、re.split:
在Python中，如果想對(duì)一個(gè)字符串進(jìn)行分割的話，只需要調(diào)用str的split方法就可以實(shí)現(xiàn)，但是這個(gè)split只能根據(jù)某個(gè)字符來(lái)進(jìn)行分割的操作，如果要同時(shí)指定多個(gè)字符來(lái)進(jìn)行分割的話，它就無(wú)法實(shí)現(xiàn)了。
好在re模塊也提供了split這個(gè)方法來(lái)對(duì)字符串進(jìn)行分割，而且這個(gè)方法更加強(qiáng)大，可以同時(shí)根據(jù)多個(gè)字符進(jìn)行分割的操作，下面來(lái)看分別看一下str的split和re的split有什么不同的地方：
str1 = 'helloword,i;am/nalex'str2 = str1.split(',')print(str2)import restr3 = re.split('[,|;|/n]',str1)print(str3)#下面是不同的輸出結(jié)果['helloword', 'i;am/nalex']['helloword', 'i', 'am', 'alex'] 從中我們可以看出，上面說(shuō)的真實(shí)性。
4、findall:
findall方法基本上都是和compile方法同時(shí)出現(xiàn)的，它們的用法是：
先由compile將一個(gè)正則表達(dá)式的字符串形式轉(zhuǎn)換成pattern實(shí)例，然后再使用patte實(shí)例調(diào)用findall方法生成match對(duì)象來(lái)獲取結(jié)果，在將它們結(jié)合的實(shí)例之前，我們先來(lái)看下正則表達(dá)式中預(yù)設(shè)的特殊字符含義：
/d 匹配任何十進(jìn)制數(shù)；它相當(dāng)于類 [0-9]。 /D 匹配任何非數(shù)字字符；它相當(dāng)于類 [^0-9]。 /s 匹配任何空白字符；它相當(dāng)于類 [ "t"n"r"f"v]。 /S 匹配任何非空白字符；它相當(dāng)于類 [^ "t"n"r"f"v]。 /w 匹配任何字母數(shù)字字符；它相當(dāng)于類 [a-zA-Z0-9_]。 /W 匹配任何非字母數(shù)字字符；它相當(dāng)于類 [^a-zA-Z0-9_]。
看完這幾個(gè)特殊字符的含義，我們?cè)倥e一個(gè)例子來(lái)說(shuō)明一下上面的論點(diǎn)：
import restr1 = 'asdf12dvdve4gb4'pattern1 = re.compile('/d')pattern2 = re.compile('[0-9]')mch1 = pattern1.findall(str1)mch2 = pattern2.findall(str1)print('mch1:/t%s'% mch1)print('mch2:/t%s'% mch2)#輸出結(jié)果mch1: ['1', '2', '4', '4']13 mch2: ['1', '2', '4', '4'] 上面的兩個(gè)實(shí)例都可以很好的闡述上面的論點(diǎn)，而且也表明了，特殊字符/d確實(shí)跟[0-9]是一樣的，通過(guò)輸出結(jié)果就可以看出，那么如果你不想把每個(gè)數(shù)字都拆分為一個(gè)元素放在列表中，而是想把12整體的輸出出來(lái)，那么你可以這樣做：（就是在/d的后面加上個(gè)+號(hào)來(lái)實(shí)現(xiàn)的，這里的+號(hào)表示的是把一個(gè)或者多個(gè)相連的十進(jìn)制數(shù)字整體輸出）
import restr1 = 'asdf12dvdve4gb4'pattern1 = re.compile('/d+')pattern2 = re.compile('[0-9]')mch1 = pattern1.findall(str1)mch2 = pattern2.findall(str1)print('mch1:/t%s'% mch1)print('mch2:/t%s'% mch2)#輸出結(jié)果mch1: ['12', '4', '4']mch2: ['1', '2', '4', '4'] 我們?cè)倥e一個(gè)小例子，這個(gè)例子是結(jié)合特殊字符和re的sub功能實(shí)現(xiàn)一下把字符串中所有的空格都給去掉：
import restr1 = 'asd /tf12d vdve4gb4'new_str = re.sub('/s*','',str)print(new_str)#輸出結(jié)果asdf12dvdve4gb4 5、元字符：
我們通常所說(shuō)的二元字符有;2元字符：. ^ $ * + { } [ ] | ( ) /
我們首先考察的元字符是"[" 和 "]"。它們常用來(lái)指定一個(gè)字符類別，所謂字符類別就是你想匹配的一個(gè)字符集。字符可以單個(gè)列出，也可以用“-”號(hào)分隔的兩個(gè)給定
字符來(lái)表示一個(gè)字符區(qū)間。例如，[abc] 將匹配"a", "b", 或 "c"中的任意一個(gè)字符；也可以用區(qū)間[a-c]來(lái)表示同一字符集，和前者效果一致。如果你只想匹配小寫(xiě)字母，那么 RE 應(yīng)寫(xiě)成 [a-z].元字符在類別里并不起作用。例如，[akm$]將匹配字符"a", "k", "m", 或 "$" 中的任意一個(gè)；"$"通常用作元字符，但在字符類別里，其特性被除去，恢復(fù)成普通字
符。
[]:元字符[]表示字符類，在一個(gè)字符類中，只有字符^、-、]和/有特殊含義。字符/仍然表示轉(zhuǎn)義，字符-可以定義字符范圍，字符^放在前面，表示非.(這個(gè)在上面的特殊字符示例中也有提現(xiàn))，
+ 匹配+號(hào)前內(nèi)容1次至無(wú)限次
匹配號(hào)前內(nèi)容0次到1次
{m} 匹配前面的內(nèi)容m次
{m,n} 匹配前面的內(nèi)容m到n次
下面通過(guò)一個(gè)小例子，來(lái)闡述一下上面的字符在元字符[]中的使用：(在下面的這個(gè)例子中，要注意的有兩點(diǎn)：一是在/d+后面的？號(hào)的含義，二是在匹配的前面加上了一個(gè)字符r,其實(shí)在這個(gè)示例中，加與不加都可以顯示一樣的結(jié)果)
import re print(re.findall(r"a(/d+ )","a123b"))['1'] print(re.findall(r"a(/d+)","a123b"))['123'] 以上所述是小編給大家介紹的python 正則表達(dá)式學(xué)習(xí)小結(jié)，希望對(duì)大家有所幫助，如果大家有任何疑問(wèn)請(qǐng)給我留言，小編會(huì)及時(shí)回復(fù)大家的。在此也非常感謝大家對(duì)phpstudy網(wǎng)站的支持！PHP教程

鄭重聲明：本文版權(quán)歸原作者所有，轉(zhuǎn)載文章僅為傳播更多信息之目的，如作者信息標(biāo)記有誤，請(qǐng)第一時(shí)間聯(lián)系我們修改或刪除，多謝。

上一篇：python刪除列表內(nèi)容

下一篇：Python rpartition()函數(shù)