国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

用Python讀取幾十萬行文本數(shù)據(jù)

2020-02-16 00:17:54
字體:
供稿:網(wǎng)友

我在使用python讀取幾十萬行的文件中的數(shù)據(jù),并構(gòu)造字典,列表等數(shù)據(jù)結(jié)構(gòu)時(shí),再訪問字典,列表時(shí),一般都會出現(xiàn)內(nèi)存不夠的問題,然后只能循環(huán)讀取幾百行或者一定數(shù)量的行數(shù)來循環(huán)操作。

keyword_list=[line.strip() for line in open("keywords.txt",'r')]#f1=open("part_wiki_vec.txt",'r')f1=open("wiki_vectors.txt")f2=open("result.txt",'w')i=0content=f1.readlines()while i<1150: for line in content[300*i:300*(i+1)]:  line=line.strip().split(' ')  if line[0] in keyword_list:   wordvec=' '.join(line)   print wordvec   f2.write(wordvec)  #print line i+=1

我是這樣讀取的

應(yīng)該還有很多好的方法,比如多線程等等。

做此記錄只為了學(xué)習(xí)

總結(jié)

以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,謝謝大家對武林站長站的支持。如果你想了解更多相關(guān)內(nèi)容請查看下面相關(guān)鏈接

發(fā)表評論 共有條評論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 克拉玛依市| 镇安县| 于田县| 肃南| 木兰县| 江北区| 资中县| 平阳县| 黄冈市| 靖远县| 汾阳市| 神池县| 赣榆县| 衡水市| 馆陶县| 库尔勒市| 黄山市| 滦南县| 淮南市| 闽清县| 蓬安县| 安泽县| 荔波县| 上高县| 大英县| 水富县| 南康市| 德江县| 基隆市| 收藏| 乳山市| 南澳县| 邵阳县| 光山县| 资溪县| 兴义市| 谢通门县| 禄丰县| 和平区| 屏南县| 平果县|