国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

Python pandas常用函數詳解

2020-02-22 23:09:24
字體:
來源:轉載
供稿:網友

本文研究的主要是pandas常用函數,具體介紹如下。

1 import語句

import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport datetimeimport re

2 文件讀取

df = pd.read_csv(path='file.csv')
參數:header=None 用默認列名,0,1,2,3...
names=['A', 'B', 'C'...] 自定義列名
index_col='A'|['A', 'B'...] 給索引列指定名稱,如果是多重索引,可以傳list
skiprows=[0,1,2] 需要跳過的行號,從文件頭0開始,skip_footer從文件尾開始
nrows=N 需要讀取的行數,前N行
chunksize=M 返回迭代類型TextFileReader,每M條迭代一次,數據占用較大內存時使用
sep=':'數據分隔默認是',',根據文件選擇合適的分隔符,如果不指定參數,會自動解析
skip_blank_lines=False 默認為True,跳過空行,如果選擇不跳過,會填充NaN
converters={'col1', func} 對選定列使用函數func轉換,通常表示編號的列會使用(避免轉換成int)

dfjs = pd.read_json('file.json') 可以傳入json格式字符串
dfex = pd.read_excel('file.xls', sheetname=[0,1..]) 讀取多個sheet頁,返回多個df的字典

3 數據預處理

df.duplicated() 返回各行是否是上一行的重復行
df.drop_duplicates() 刪除重復行,如果需要按照列過濾,參數選填['col1', 'col2',...]
df.fillna(0) 用實數0填充na
df.dropna() axis=0|1 0-index 1-column
how='all'|'any' all-全部是NA才刪 any-只要有NA就全刪
del df['col1'] 直接刪除某一列
df.drop(['col1',...], aixs=1) 刪除指定列,也可以刪除行
df.column = col_lst 重新制定列名
df.rename(index={'row1':'A'}, 重命名索引名和列名
columns={'col1':'A1'})
df.replace(dict) 替換df值,前后值可以用字典表,{1:‘A', '2':'B'}

def get_digits(str):
m = re.match(r'(/d+(/./d+)?)', str.decode('utf-8'))
if m is not None:
return float(m.groups()[0])
else:
return 0
df.apply(get_digits) DataFrame.apply,只獲取小數部分,可以選定某一列或行
df['col1'].map(func) Series.map,只對列進行函數轉換

pd.merge(df1, df2, on='col1',
how='inner',sort=True) 合并兩個DataFrame,按照共有的某列做內連接(交集),outter為外連接(并集),結果排序

pd.merge(df1, df2, left_on='col1',
right_on='col2') df1 df2沒有公共列名,所以合并需指定兩邊的參考列


pd.concat([sr1, sr2, sr3,...], axis=0) 多個Series堆疊成多行,結果仍然是一個Series
pd.concat([sr1, sr2, sr3,...], axis=1) 多個Series組合成多行多列,結果是一個DataFrame,索引取并集,沒有交集的位置填入缺省值NaN

df1.combine_first(df2) 用df2的數據補充df1的缺省值NaN,如果df2有更多行,也一并補上

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 合山市| 海晏县| 广丰县| 九龙城区| 日照市| 莆田市| 承德市| 康定县| 天津市| 丰城市| 永兴县| 浏阳市| 贵南县| 梓潼县| 镇沅| 白河县| 黄骅市| 台北县| 安庆市| 大港区| 凌云县| 登封市| 民丰县| 福安市| 从江县| 秀山| 登封市| 沾益县| 福海县| 丰台区| 张家港市| 商水县| 抚顺市| 龙井市| 墨脱县| 麻城市| 百色市| 佳木斯市| 黑山县| 磐石市| 治多县|