国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

Python 文本文件內容批量抽取實例

2020-02-16 00:01:31
字體:
來源:轉載
供稿:網友

Python新手編寫腳本處理數據,各種心酸各種語法查找,以此留念!

原始數據格式如下圖所示:

Python 文本文件內容批量抽取

這里是一個人臉測試數據,其中每行第一個為測試圖片編號,后面為Top 7圖片編號及其對應的評分,即與測試圖片的相似度度量結果。我們這里的目的是將每行Top 7對應的評分數據抽取出來,并且將評分第二的數值與一個閾值(這里是0.7)進行比較,超過閾值表示此次測試成功,結果為正樣本,記為1,否則置0。并最終將其保存至另一個文本文件用于作為機器學習模型的訓練樣本數據。

Python腳本處理后的文件格式如下所示:

Python 文本文件內容批量抽取

對應的Python代碼如下所示,附有小白詳細注釋。

# -*- coding: cp936 -*-import reimport linecachefilename = 'face_test_data.txt' with open(filename, 'r') as f: line = f.readline() while line:  eachline = line.split()###按行讀取文本文件  #print eachline 返回一個列表,以空格作為元素拆分標識  #print line 返回的是一整行數據,相當于一個字符串元素  count = len(eachline)#返回列表長度,即列表元素數目  n = 0  element = []#初始化空列表用于存儲所需評分數據  while n < count:   elem_index = eachline[n:n+1] #類型為列表   #print elem_index, len(elem_index[0])   #print elem_index 返回類型為列表   if len(elem_index[0]) > 24:    element.append(elem_index[0][25:])   #element = [qiege(elem_index[n]) for elem_index in eachline]   n=n+1  #print element[1] #概率數值列表    if element[1] >= '0.7':   element.append(1)   #print '1'  else:   element.append(0)   #print '0'     #生成每行末尾有/t文件  '''   file = open('preprocess.txt', 'a')  for i in range(len(element)):   file.write(str(element[i])+'/t')  file.write('/n')  file.close()  '''  #生成每行末尾無/t文件,可直接用于np.loadtxt()讀取文本生成矩陣數據  file = open('_preprocess.txt', 'a')  for i in range(len(element)-1):   file.write(str(element[i])+'/t')  file.write(str(element[-1])+'/n')  #file.write('/n')  file.close()    line = f.readline()

以上這篇Python 文本文件內容批量抽取實例就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持武林站長站。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 高阳县| 临清市| 巴林右旗| 尉氏县| 育儿| 长阳| 铁力市| 额济纳旗| 凤山县| 集安市| 保靖县| 遵义市| 肃北| 上虞市| 溧水县| 金秀| 伊吾县| 玉山县| 东港市| 怀来县| 高要市| 洛川县| 乡宁县| 亚东县| 宜兰县| 玉树县| 黄龙县| 宜章县| 慈利县| 咸宁市| 浦东新区| 浦县| 封丘县| 台北市| 清丰县| 临沂市| 长宁区| 从化市| 寿宁县| 吉木乃县| 兰西县|