今天發現用pandas里面的數據結構可以減少大量的編程工作,從現在開始逐漸積累,記錄一下:
使用標簽選取數據:
df.loc[行標簽,列標簽]df.loc['a':'b']#選取ab兩行數據df.loc[:,'one']#選取one列的數據
df.loc的第一個參數是行標簽,第二個參數為列標簽(可選參數,默認為所有列標簽),兩個參數既可以是列表也可以是單個字符,如果兩個參數都為列表則返回的是DataFrame,否則,則為Series。
示例代碼:
df.loc[ (df.Cabin.notnull()), 'Cabin' ] = "Yes"
上一行代碼的意思是:選取Cabin列中不為空的位置替換為“Yes”,df是一個二維數據集
這篇pandas.loc 選取指定列進行操作的實例就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持武林站長站。
新聞熱點
疑難解答