使用Python向DataFrame中指定位置添加一列或多列的方法

2020-02-16 00:59:25

字體：大中小

來源：轉載

供稿：網友

對于這個問題，相信很多人都會很困惑，本篇文章將會給大家介紹一種非常簡單的方式向DataFrame中任意指定的位置添加一列。

在此之前或許有不少讀者已經了解了最普通的添加一列的方式，如下：

import pandas as pd feature = pd.read_csv("C://Users//Machenike//Desktop//xzw//lr_train_data.txt", delimiter="/t", header=None, usecols=[0, 1])feature.columns = ["a","b"]print(feature.head())feature['c']='1'print(feature.head())

這種添加方式得到的結果如下：

     a     b0 4.459256 8.2254181 0.043276 6.3074002 6.997162 9.3133933 4.754832 9.2603784 8.661904 9.767977     a     b c0 4.459256 8.225418 11 0.043276 6.307400 12 6.997162 9.313393 13 4.754832 9.260378 14 8.661904 9.767977 1

同樣的也會有人想到concat()函數（關于concat()函數的更多介紹，可以參考我的另外一篇博客《在Pandas中DataFrame數據合并、連接（concat、merge、join）的實例》），如下：

import pandas as pd feature = pd.read_csv("C://Users//Machenike//Desktop//xzw//lr_train_data.txt", delimiter="/t", header=None, usecols=[0, 1])feature.columns = ["a","b"]print(feature.head())feature = pd.concat([feature, pd.DataFrame(columns=list('c'))])print(feature.head())

利用concat()函數添加的結果如下：

     a     b0 4.459256 8.2254181 0.043276 6.3074002 6.997162 9.3133933 4.754832 9.2603784 8.661904 9.767977     a     b  c0 4.459256 8.225418 NaN1 0.043276 6.307400 NaN2 6.997162 9.313393 NaN3 4.754832 9.260378 NaN4 8.661904 9.767977 NaN

上述兩種方法添加一列存在一個弊端，那就是只能在DataFrame的末尾即最后一列添加。但是在有些情況下，我們需要在DataFrame的第一列或中間列位置添加新的一列，那么，有沒有一種方法可以指定位置添加一列呢？答案是肯定的，這就是本文一開始所說的那種及其簡單的方法。

如下：

import pandas as pd feature = pd.read_csv("C://Users//Machenike//Desktop//xzw//lr_train_data.txt", delimiter="/t", header=None, usecols=[0, 1])feature.columns = ["a","b"]print(feature.head())feature = feature.reindex(columns=list('cab'), fill_value=1)print(feature.head())

上面代碼中的使用了reindex()方法，reindex()方法可以添加一列或多列數據，并且可以指定列的位置，也可以對原先存在的列進行重排。方法中的columns屬性控制著列的位置，c是添加的一列，其位于a和b前面，這說明c列是新數據框的第一列，fill_value屬性指定的是添加一列的值，其結果如下：

     a     b0 4.459256 8.2254181 0.043276 6.3074002 6.997162 9.3133933 4.754832 9.2603784 8.661904 9.767977  c     a     b0 1 4.459256 8.2254181 1 0.043276 6.3074002 1 6.997162 9.3133933 1 4.754832 9.2603784 1 8.661904 9.767977

上一篇：Python不同目錄間進行模塊調用的實現方法

下一篇：對DataFrame數據中的重復行,利用groupby累加合并的方法詳解