国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

python解析基于xml格式的日志文件

2020-02-23 04:23:04
字體:
來源:轉載
供稿:網友

大家中午好,由于過年一直還沒回到狀態,好久沒分享一波小知識了,今天,繼續給大家分享一波Python解析日志的小腳本。

首先,同樣的先看看日志是個啥樣。

都是xml格式的,是不是看著就頭暈了??沒事,我們先來分析一波。

1.每一段開頭都是catalina-exec,那么我們就按catalina-exec來分,分了之后,他們就都是一段一段的了。

2.然后,我們再在已經分好的一段段里面分,找出你要分割的關鍵字,因為是xml的,所以,接下來的工作就簡單了,都是一個頭一個尾的。

3.但是還有一個問題,有可能有的里面沒有你想要的關鍵字,所以你要判斷下,如果沒有這個字段,那么我就把這個字段設置為空。

思路清晰了,代碼自然而然就簡單了。

接下來我們就看看代碼

#coding:utf-8 import re #文本所在TXT文件 file = 'iag_interface.log' #分割一段 xml1='catalina-exec' xml2='catalina-exec' #關鍵字reqtimestamp time1 = '<timestamp>' time2 = '</timestamp>' #關鍵字functionid functionid1 = '<functionid>' functionid2 = '</functionid>' #關鍵字transid transid1='<transid>' transid2='</transid>' #關鍵字siappid siappid1='<siappid>' siappid2='</siappid>' #關鍵字userid userid1='<userid>' userid2='</userid>' #關鍵字mobnum mobnum1='<mobnum>' mobnum2='</mobnum>' f = open(file,'r',encoding= 'utf-8') #f = open(file,'r') #for (num,value) in enumerate(f):  #print("line number",num,"is:",value) buff = f.read() #清除換行符,請取消下一行注釋 #buff = buff.replace('/n','') pat = re.compile(time1+'(.*?)'+time2,re.S) pat1 = re.compile(functionid1+'(.*?)'+functionid2,re.S) pat2 = re.compile(transid1+'(.*?)'+transid2,re.S) pat3 = re.compile(siappid1+'(.*?)'+siappid2,re.S) pat4 = re.compile(userid1+'(.*?)'+userid2,re.S) pat5 = re.compile(mobnum1+'(.*?)'+mobnum2,re.S) pat6=re.compile(xml1+'(.*?)'+xml2,re.S) result6 = pat6.findall(buff) print(len(result6)) x = open("logfx.txt", 'w') x.write("===========================開始數據================================="+"/n") x.write("time"+"/t"+"functionid"+"/t"+"transid"+"/t"+"siappid"+"/t"+"userid"+"/t"+"mobnum"+"/n") for i in range(0,len(result6)):  result = pat.findall(result6[i])  result1 = pat1.findall(result6[i])  result2 = pat2.findall(result6[i])  result3 = pat3.findall(result6[i])  result4 = pat4.findall(result6[i])  result5 = pat5.findall(result6[i])  if len(result)==0:   result.append("空")  if len(result1)==0:   result1.append("空")  if len(result2)==0:   result2.append("空")  if len(result3)==0:   result3.append("空")  if len(result4)==0:   result4.append("空")  if len(result5)==0:   result5.append("空")  #print(result[0],"=",result1[0],"=",result2[0],"=",result3[0],"=",result4[0],"=",result5[0])  x.write("timestamp:"+result[0]+"/t"+result1[0]+"/t"+result2[0]+"/t"+result3[0]+"/t"+result4[0]+"/t"+"mobnum:"+result5[0]+"/n") x.write("===========================結束數據================================="+"/n")  print("執行完畢!生成文件logfx.txt") x.close()             
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 嘉善县| 湄潭县| 太保市| 夹江县| 祁连县| 丽江市| 望城县| 大安市| 迁西县| 泰宁县| 楚雄市| 高清| 游戏| 乳源| 南京市| 夏邑县| 诸暨市| 赤城县| 南皮县| 九龙县| 和平县| 侯马市| 永善县| 周口市| 玉门市| 嘉祥县| 新源县| 西丰县| 三门峡市| 麻栗坡县| 库尔勒市| 前郭尔| 莲花县| 库伦旗| 舟曲县| 义马市| 和硕县| 云梦县| 锦屏县| 廊坊市| 邢台县|