国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

pandas DataFrame 刪除重復(fù)的行的實(shí)現(xiàn)方法

2020-02-16 00:57:41
字體:
供稿:網(wǎng)友

1. 建立一個(gè)DataFrame

 C=pd.DataFrame({'a':['dog']*3+['fish']*3+['dog'],'b':[10,10,12,12,14,14,10]})

2. 判斷是否有重復(fù)項(xiàng)

用duplicated( )函數(shù)判斷  

C.duplicated()

3.  有重復(fù)項(xiàng),則可以用drop_duplicates()移除重復(fù)項(xiàng)

C.drop_duplicates()

4. Duplicated( )和drop_duplicates( )方法是以默認(rèn)的方式判斷全部的列(上面的例子中是看兩個(gè)變量a和b是否都是重復(fù)出現(xiàn))。

我們也可以對特定的列進(jìn)行重復(fù)項(xiàng)判斷。

 C.duplicated(['a'])   C.drop_duplicates(['a']) C.duplicated(['b'])   C.drop_duplicates(['b'])

5.  norepeat_df = df.drop_duplicates(subset=['A_ID', 'B_ID'], keep='first')

#上面的命令去掉UNIT_ID和KPI_ID列中重復(fù)的行,并保留重復(fù)出現(xiàn)的行中第一次出現(xiàn)的行

補(bǔ)充: 

當(dāng)keep=False時(shí),就是去掉所有的重復(fù)行  當(dāng)keep=‘first'時(shí),就是保留第一次出現(xiàn)的重復(fù)行  當(dāng)keep='last'時(shí)就是保留最后一次出現(xiàn)的重復(fù)行。 

(注意,這里的參數(shù)是字符串,要加引號(hào)!!!)

以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持武林站長站。

發(fā)表評論 共有條評論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 邻水| 双流县| 遵化市| 乐亭县| 南陵县| 江油市| 五寨县| 浦县| 苍南县| 勐海县| 广饶县| 佳木斯市| 东安县| 金沙县| 天水市| 鹰潭市| 和林格尔县| 武胜县| 宁都县| 长子县| 澎湖县| 当雄县| 那曲县| 高台县| 兴化市| 金川县| 湖口县| 南漳县| 融水| 常熟市| 闽侯县| 文登市| 陇川县| 赫章县| 温宿县| 灵山县| 静海县| 清苑县| 徐汇区| 海林市| 夏邑县|