Python做簡(jiǎn)單的字符串匹配詳解
由于需要在半結(jié)構(gòu)化的文本數(shù)據(jù)中提取一些特定格式的字段、數(shù)據(jù)輔助挖掘分析工作,以往都是使用Matlab工具進(jìn)行結(jié)構(gòu)化數(shù)據(jù)處理的建模,matlab擅長(zhǎng)矩陣處理、結(jié)構(gòu)化數(shù)據(jù)的計(jì)算,Python具有與matlab共同的特點(diǎn):語(yǔ)法簡(jiǎn)潔、庫(kù)豐富,對(duì)算法仿真來(lái)說(shuō)都是一門(mén)簡(jiǎn)潔易用的語(yǔ)言。
Python做字符串匹配相對(duì)來(lái)說(shuō)上手比較容易,且具有成熟的字符串處理庫(kù)re供我們使用;
在re庫(kù)的幫助下,只需簡(jiǎn)單的兩步就可完成匹配工作,對(duì)做數(shù)據(jù)分析/算法的工作者來(lái)說(shuō),輕松了許多:
step1:構(gòu)建正則表達(dá)式模式,并使用compile()函數(shù)生產(chǎn)正則表達(dá)式對(duì)象
step2:調(diào)用step1生成的正在表達(dá)式對(duì)象的方法、屬性,返回匹配結(jié)果
<span style="color:#333300;"># 導(dǎo)入正則表達(dá)式匹配模塊 Py 3.0 import re text = "today is 01/04/2015, happy new year..." #建立日期的正則表達(dá)式 detepat = re.compile('(/d+)/(/d+)/(/d+)') #進(jìn)行匹配并打印結(jié)果 result = detepat.finditer(text) for m in result: print(m.group())</span>
感謝閱讀,希望能幫助到大家,謝謝大家對(duì)本站的支持!
新聞熱點(diǎn)
疑難解答
圖片精選