国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

利用python如何處理百萬條數據(適用java新手)

2020-02-15 21:40:18
字體:
來源:轉載
供稿:網友

1、前言

因為負責基礎服務,經常需要處理一些數據,但是大多時候采用awk以及java程序即可,但是這次突然有百萬級數據需要處理,通過awk無法進行匹配,然后我又采用java來處理,文件一分為8同時開啟8個線程并發處理,但是依然處理很慢,處理時長起碼在1天+所以無法忍受這樣的處理速度就采用python來處理,結果速度有了質的提升,大約處理時間為1個小時多一點,這個時間可以接受,后續可能繼續采用大數據思想來處理,相關的會在后續繼續更新。

2、安裝python 

第一步首先下載python軟件,在官網可以根據自己情況合理下載,大家也可以通過武林站長站進行下載其余就是下一步搞定,然后在開始里面找到python的exe,點擊開然后輸入1+1就可以看出是否安裝成功了.如下圖

 

3、IEDA編輯器如何使用python

首先我們在idea中打開設置然后點擊plugins,在里面有個輸入框中輸入python,根據提示找到如下的這個(idea版本不同可能影響python版本)

 

然后開始創建idea工程

file->New->Project->python然后出現如下圖情況(其他的下一步然后就會創建工程了)

4、開發前知識準備

文件的讀取,python讀取文件非常的簡單,我現在直接貼代碼提供給大家

def readData(fileName): result = "" count=0 with open(fileName, 'r') as f: for line in f.readlines():  result += line  count += 1  print count return result"""寫入文件"""def writeData(fileName, data): with open(fileName, 'a+')as f: f.write(data)

其中def是函數的定義,如果我們寫定義一個函數直接前面加上def,返回值可以獲取后直接用return即可

python我們直接采用with open('文件路徑',模式) as f的方式來打開文件

模式:

r 只讀 文件不存在則出錯
r+ 支持讀寫 文件不存在則出錯,寫入時,會覆蓋源文件
w 只寫 如果文件不存在則創建文件,會覆蓋源文件,如果寫入內容少則保留為覆蓋的內容
w+ 支持讀寫 同上
a 只寫 如果文件不存在則創建文件,會采用追加模式
a+ 讀寫 同上
b 二進制讀寫  
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 西乌珠穆沁旗| 赣州市| 息烽县| 龙山县| 二手房| 塔城市| 宜春市| 凭祥市| 吉木乃县| 高尔夫| 涿州市| 舒兰市| 霞浦县| 体育| 平罗县| 岗巴县| 黄梅县| 茌平县| 县级市| 阿拉尔市| 轮台县| 措勤县| 临城县| 安化县| 荥经县| 棋牌| 拉孜县| 津南区| 沁源县| 卓资县| 民县| 怀来县| 千阳县| 江安县| 枣强县| 边坝县| 中超| 澳门| 乌拉特后旗| 密山市| 宜川县|