国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

Python正則表達(dá)式匹配中文用法示例

2020-02-23 04:16:10
字體:
供稿:網(wǎng)友

本文實(shí)例講述了Python正則表達(dá)式匹配中文用法。分享給大家供大家參考,具體如下:

#!/usr/bin/python#-*- coding:cp936-*-#思路,將str轉(zhuǎn)換成unicode,方可用正則表達(dá)式,前提是,要知道文件的編碼,本例中是gbkimport cPickle as mypickleimport reimport sysif (__name__=='__main__'):  fid1=file('demo.txt','r');#demo.txt寫入字符如:武林站長站  p=re.compile('(^/s+|/s+$)');  phanzigbk=re.compile('[//x20-//x7f]');  phanzi=re.compile(u'[/u4e00-/u9fa5]');#這里要加u,注意  commlines=fid1.readlines();  fid1.close();  dictfamilyname={};  dictfirstname={};  for line in commlines:    line=p.sub('',line);    print type(line);    print line;    uline=unicode(line,'gbk');    print type(uline);    candidates=phanzi.findall(uline);    print len(candidates);    if(len(candidates)==2):      print candidates[0];      familynamegbk=candidates[0].encode('gbk');#把unicode型的變量變成str型的變量      firstnamegbk=candidates[1].encode('gbk');      if(dictfamilyname.has_key(familynamegbk)):        dictfamilyname[familynamegbk]=dictfamilyname[familynamegbk]+1;      else:        dictfamilyname[familynamegbk]=1;      if(dictfirstname.has_key(firstnamegbk)):        dictfirstname[firstnamegbk]=dictfirstname[firstnamegbk]+1;      else:        dictfirstname[firstnamegbk]=1;  familynameitems=dictfamilyname.items();  print familynameitems;  firstnameitems=dictfirstname.items();  familynameitems.sort(key=lambda d:d[1],reverse=True);  firstnameitems.sort(key=lambda d :d[1],reverse=True);  fid=file('familyname.txt','w');  for m in familynameitems:    s=m[0]+'/t'+str(m[1]);    fid.write(s);    fid.write('/n');  fid.close();  fid=file('firstname.txt','w');  for m in firstnameitems:    s=m[0]+'/t'+str(m[1]);    fid.write(s);    fid.write('/n');  fid.close();  print 'finish'

運(yùn)行效果圖如下:

PS:這里再為大家提供2款非常方便的正則表達(dá)式工具供大家參考使用:

JavaScript正則表達(dá)式在線測試工具:
http://tools.jb51.net/regex/javascript

正則表達(dá)式在線生成工具:
http://tools.jb51.net/regex/create_reg

更多關(guān)于Python相關(guān)內(nèi)容可查看本站專題:《Python正則表達(dá)式用法總結(jié)》、《Python數(shù)據(jù)結(jié)構(gòu)與算法教程》、《Python Socket編程技巧總結(jié)》、《Python函數(shù)使用技巧總結(jié)》、《Python字符串操作技巧匯總》、《Python入門與進(jìn)階經(jīng)典教程》及《Python文件與目錄操作技巧匯總》

希望本文所述對大家Python程序設(shè)計(jì)有所幫助。

發(fā)表評論 共有條評論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 铜陵市| 庄河市| 工布江达县| 海城市| 靖州| 衡阳市| 晴隆县| 读书| 新昌县| 建始县| 沽源县| 沙田区| 临澧县| 万源市| 甘孜县| 北辰区| 香格里拉县| 上栗县| 长宁区| 永顺县| 镇雄县| 长岛县| 扶绥县| 曲靖市| 吉林市| 江油市| 宁波市| 宁河县| 满洲里市| 乌兰察布市| 宣威市| 临洮县| 本溪市| 岑巩县| 电白县| 博白县| 桑日县| 宁远县| 井研县| 苍南县| 兴隆县|