国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

Python對多屬性的重復(fù)數(shù)據(jù)去重實例

2020-02-22 23:43:17
字體:
供稿:網(wǎng)友

python中的pandas模塊中對重復(fù)數(shù)據(jù)去重步驟:

1)利用DataFrame中的duplicated方法返回一個布爾型的Series,顯示各行是否有重復(fù)行,沒有重復(fù)行顯示為FALSE,有重復(fù)行顯示為TRUE;

2)再利用DataFrame中的drop_duplicates方法用于返回一個移除了重復(fù)行的DataFrame。

注釋:

如果duplicated方法和drop_duplicates方法中沒有設(shè)置參數(shù),則這兩個方法默認會判斷全部咧,如果在這兩個方法中加入了指定的屬性名(或者稱為列名),例如:frame.drop_duplicates(['state']),則指定部分列(state列)進行重復(fù)項的判斷。

具體實例如下:

>>> import pandas as pd >>> data={'state':[1,1,2,2],'pop':['a','b','c','d']} >>> frame=pd.DataFrame(data) >>> frame  pop state 0 a  1 1 b  1 2 c  2 3 d  2 >>> IsDuplicated=frame.duplicated() >>> print IsDuplicated 0 False 1 False 2 False 3 False dtype: bool >>> frame=frame.drop_duplicates(['state']) >>> frame  pop state 0 a  1 2 c  2 >>> IsDuplicated=frame.duplicated(['state']) >>> print IsDuplicated 0 False 2 False dtype: bool >>> 

以上這篇Python對多屬性的重復(fù)數(shù)據(jù)去重實例就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持武林站長站。

發(fā)表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發(fā)表
主站蜘蛛池模板: 获嘉县| 广灵县| 云梦县| 贡觉县| 长沙市| 泰兴市| 武汉市| 墨竹工卡县| 双城市| 新民市| 高安市| 成都市| 叙永县| 朔州市| 女性| 旬邑县| 武鸣县| 炉霍县| 永新县| 屏边| 北流市| 关岭| 余干县| 遂溪县| 买车| 鄯善县| 通许县| 华容县| 南华县| 诸暨市| 惠安县| 株洲市| 许昌县| 微山县| 德庆县| 获嘉县| 博湖县| 榆树市| 福泉市| 丁青县| 孟津县|