pandas修改DataFrame列名的實現方法

2020-02-16 01:19:18

字體：大中小

來源：轉載

供稿：網友

提出問題

存在一個名為dataset的DataFrame

>>> dataset.columnsIndex(['age', 'job', 'marital', 'education', 'default', 'housing', 'loan',    'contact', 'month', 'day_of_week', 'duration', 'campaign', 'pdays',    'previous', 'poutcome', 'emp.var.rate', 'cons.price.idx',    'cons.conf.idx', 'euribor3m', 'nr.employed', 'y'],   dtype='object')

現在, 我要將其columns名字改為:

>>> new_columnsIndex(['age_0', 'job_1', 'marital_2', 'education_3', 'default_4', 'housing_5',    'loan_6', 'contact_7', 'month_8', 'day_of_week_9', 'duration_10',    'campaign_11', 'pdays_12', 'previous_13', 'poutcome_14',    'emp.var.rate_15', 'cons.price.idx_16', 'cons.conf.idx_17',    'euribor3m_18', 'nr.employed_19', 'y_20'],   dtype='object')

該如何操作？

解決

一.通過DataFrame.columns類的自身屬性修改:

1.無腦賦值直接修改

>>> # 先解決`new_columns`的推導問題>>> # 列表推導>>> new_columns_list = [column_str+'_'+str(i) for i ,column_str in enumerate(dataset.columns)]>>> # 類型轉換>>> new_columns = pd.core.indexes.base.Index(new_columns_list)>>> dataset.columns = new_columns

2.通過.map(mapper, na_action=None)函數來修改

>>> # 注:mapper 多運用 lambda 表達式>>> # 但我似乎沒有找到在 lambda 表達式中改變兩個值的方法>>> # 所以只能蹩腳地用一個全局變量i, 和映射函數mapper()>>> # 希望大家能幫我找到方法>>> i = 0>>> def mapper(x): # 映射函數即 mapper  global i  x += '_' + str(i)  i += 1  return x>>> dataset.columns.map(mapper)

3.參考博客用到了DataFrame.columns.str對象

用help(DataFrame.columns.str)翻遍了文檔，

也沒能找到可以被我拿來套用的方法, 想著抽時間把這段文檔翻譯一下

二.通過DataFrame.rename()函數來修改

1.暴力字典法(好處：可以只修改特定的列)

>>> # 此處先用字典推導法>>> new_dict = {  key:key+'_'+str(i)  for i, key in enumerate(dataset.columns)  }>>> dataset.rename(columns=new_dict, inplace=True)

2.映射修改法

>>> # 原博文依然用到了 lambda 表達式>>> # 我就再生搬硬套一次, 把上面的復制過來>>> # 蹩腳地用一個全局變量i, 和映射函數mapper()>>> i = 0>>> def mapper(x): # 映射函數即 mapper  global i  x += '_' + str(i)  i += 1  return xdataset.rename(columns=mapper, inplace=True)

稍微總結一下 : 字典推導和列表推導的使用方法很類似, 最大的區別是選擇中括號還是大括號

上一篇：python 多線程串行和并行的實例

下一篇：Python實現求兩個數組交集的方法示例