踩坑記錄:
用pandas來(lái)做csv的缺失值處理時(shí)候發(fā)現(xiàn)奇怪BUG,就是excel打開(kāi)csv文件,明明有的格子沒(méi)有任何東西,當(dāng)然,我就想到用pandas的dropna()或者fillna()來(lái)處理缺失值。
但是pandas讀取csv文件后發(fā)現(xiàn)那個(gè)空的地方isnull()竟然是false,就是說(shuō)那個(gè)地方有東西。。。
后來(lái)經(jīng)過(guò)排查發(fā)現(xiàn)看似什么都沒(méi)有的地方有空字符串,故pandas認(rèn)為那兒不是缺失值,所以就不能用dropna()或者fillna()來(lái)處理。
解決思路:先用正則將空格匹配出來(lái),然后全部替換為NULL,再在用pandas讀取csv時(shí)候指定 read_csv(na_values='NULL')就是將NULL認(rèn)為是nan處理,接下來(lái)就可以用dropna()或者fillna()來(lái)處理了
以上這篇python解決pandas處理缺失值為空字符串的問(wèn)題就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持武林站長(zhǎng)站。
新聞熱點(diǎn)
疑難解答
圖片精選