在做機器學習的時候,遇到這樣一個數據集...
一共399行10列,
1-9列是用不定長度的空格分割,
第9-10列之間用'/t'分割,
前九列都是數值類型,其中第三列有若干個'?'填充的缺失值...
第十列是字符串類型,..
部分數據截圖:

之前我是用python強寫的...很麻煩,代碼如下:


至此,可以已平均值,填充缺失值...
今天再回顧此數據庫;決定用pandas庫來試試;
1,導包,用pandas.read_table導入數據集,

2,數據處理

最后輸出如下:

以上這篇python處理兩種分隔符的數據集方法就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持武林站長站。
新聞熱點
疑難解答