国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

pandas去重復行并分類匯總的實現方法

2020-02-16 00:58:27
字體:
來源:轉載
供稿:網友

今天主要記錄一下pandas去重復行以及如何分類匯總。以下面的數據幀作為一個例子: 

import pandas as pddata=pd.DataFrame({'產品':['A','A','A','A'],'數量':[50,50,30,30]})

pandas判斷dataframe是否含有重復行數據用:df.duplicated()

 第一次出現的數據為False.重復的數據行就被記錄為True。

去掉重復行數據使用data.drop_duplicates().

 可以看到索引亂了,我們使用data.reset_index(),里面的參數drop=True,表明要舍掉原來的索引,不然的話原來的索引會保留下來。

 分類匯總主要使用groupby(表明匯總的條件列)以及agg(要匯總的字段/列以及匯總的方式:求和還是最大最小值或者計數)。完整代碼如下圖

# -*- coding: utf-8 -*-"""Created on Fri Jul 20 09:08:10 2018@author: FanXiaoLei"""import pandas as pddata=pd.DataFrame({'產品':['A','A','A','A'],'數量':[50,50,30,30]})if data.duplicated:  dataA=data.drop_duplicates().reset_index(drop=True)print(dataA)dataB=dataA.groupby(by='產品').agg({'數量':sum})print('數據匯總結果:')print(dataB)

結果展示如下圖:

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持武林站長站。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 新化县| 孟津县| 宁陵县| 噶尔县| 金沙县| 许昌市| 友谊县| 罗江县| 桓仁| 聂荣县| 南华县| 吉木乃县| 新乐市| 襄垣县| 海淀区| 佳木斯市| 哈尔滨市| 鄂托克旗| 车险| 祁阳县| 龙井市| 左云县| 五华县| 景泰县| 海门市| 太湖县| 蕉岭县| 林周县| 延长县| 张家界市| 吉首市| 祁门县| 阿图什市| 明光市| 肇源县| 南江县| 紫云| 定日县| 玛沁县| 边坝县| 彝良县|