国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

淺談pandas用groupby后對層級索引levels的處理方法

2020-02-15 23:33:09
字體:
來源:轉載
供稿:網友

層及索引levels,剛開始學習pandas的時候沒有太多的操作關于groupby,僅僅是簡單的count、sum、size等等,沒有更深入的利用groupby后的數據進行處理。近來數據處理的時候有遇到這類問題花了一點時間,所以這里記錄以及復習一下:(以下皆是個人實踐后的理解)

我使用一個實例來講解下面的問題:一張數據表中有三列(動物物種、物種品種、品種價格),選出每個物種從大到小品種的前兩種,最后只需要品種和價格這兩列。

pandas groupby后對層級索引levels

以上這張表是我們后面需要處理的數據表 (物種 品種 價格)

levels:層及索引 (創建pandas類型時可以預先定義;使用groupby后也會生成)

我們看看levels什么樣(根據df1物種分類,再根據df2品種排序后 如下圖)

pandas groupby后對層級索引levels

圖中可以看出,根據groupby分類后的cat、dog便是level,以及后面的一列原始位置索引也是level

好了現在簡單了解levels,我們該如何對它進行處理,如何完成上面的實例呢?(可能你拿到這樣的層級數據,不會操作,不知道如何提取其中的信息)

代碼及講解如下:

首先導入pandas、numpy庫,以及創建原始數據:

import pandas as pdimport numpy as npdf = pd.DataFrame({'df1':['cat','cat','dog','cat','dog','dog'],'df2':[2,3,4,1,3,1],'df3':[100,200,100,300,200,200]})

原始數據最上面那張圖

下面我們根據物種來分類,并且使用apply調用sort_df2函數對品種進行排序:

def sort_df2(data): data = data.sort_values(by='df2',ascending=False) #df2:品種列 ascending:排序方式 return datagroup = df.groupby(df['df1']).apply(sort_df2) #groupby以及apply的結合使用

處理后數據,上面第二張圖

print(group.index) #看看groupby后的行索引什么樣

pandas groupby后對層級索引levels

groupby后如上圖,有層級標簽(這里兩列),labels標簽(分類,位置)

這里我們需要的是第一層級標簽的第一列(也就是cat、dog)

levels = group.index.levels[0] #取出第一級標簽:

下面將是兩層循環,完成從中選出(物種前兩個品種以及它的價格),很簡單的操作:

values = []for i in levels: mid_group = group.loc[i] #選出i標簽物種的所有品種 mid_group = mid_group.iloc[:2,:] #我們只取排序后的品種的前兩種(要注意這里使用iloc,它與loc的區別) cnt = len(mid_group) #為了防止循環長度錯誤,所以我們還是需要計算長度,因為如果真正數據不足2條還是不報錯 for j in range(cnt): #現在在每個物種cat、dog中操作 value = mid_group.iloc[j,:] #我們選出該物種的第j條所有信息df1、df2、df3 value_pro = (value['df2'],value['df3']) #然后只取df2、df3,將它們放到元組中 values.append(value_pro)            
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 刚察县| 兴义市| 嘉峪关市| 湖州市| 招远市| 黄浦区| 顺义区| 临洮县| 庄河市| 泰顺县| 广汉市| 历史| 宁夏| 泗水县| 昌都县| 宁城县| 嘉鱼县| 长沙市| 长沙县| 太保市| 乐业县| 灌南县| 宁陕县| 杂多县| 卢氏县| 贺兰县| 乌兰察布市| 翁牛特旗| 怀宁县| 达尔| 昌江| 西盟| 调兵山市| 凌云县| 米林县| 大渡口区| 琼海市| 青海省| 镇江市| 光泽县| 都兰县|