国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

python基礎(chǔ)數(shù)據(jù)分析--pandas(一)

2019-11-06 08:06:36
字體:
供稿:網(wǎng)友

本文為原創(chuàng),未經(jīng)允許,不得轉(zhuǎn)載。

1、pandas的數(shù)據(jù)結(jié)構(gòu)

1)Series:是一種類似于一維數(shù)組的對象,它由一組數(shù)據(jù)(各種NumPy數(shù)據(jù)類型)以及一組與之相關(guān)的數(shù)據(jù)標(biāo)簽(即索引)組成。它可以看做一個定長的有序字典。基本任意的一維數(shù)據(jù)都可以用來構(gòu)造 Series 對象。

2)DataFrame:是一個表格型的數(shù)據(jù)結(jié)構(gòu),它含有一組有序的列,每列可以是不同的值類型(數(shù)值、字符串、布爾值的)。DataFrame既有行索引也有列索引,它可以被看做由Series組成的字典。

Series 和 DataFrame 分別對應(yīng)于numpy一維的序列和二維的表結(jié)構(gòu)。

2. pandas的數(shù)據(jù)結(jié)構(gòu)DataFrame是一個表格型的數(shù)據(jù)結(jié)構(gòu),它含有一組有序的列,每列可以是不同的值類型(數(shù)值、字符串、布爾值的)。

下面具體練習(xí):

import pandas as pd

import numpy as np

#Series 對象包含兩個主要的屬性:index 和 values

w =pd.Series(data=[1,3,5,7],index = ['a','b','c','d'])

PRint (w)
a    1

b    3

c    5

d    7

dtype: int64

w.index

Index(['a', 'b', 'c', 'd'], dtype='object')

w.values

array([1, 3, 5, 7], dtype=int64)

s = pd.Series([1,3,5,np.nan,6,8])

print(s)

0    1.0

1    3.0

2    5.0

3    NaN

4    6.0

5    8.0

dtype: float64

##非常常用的函數(shù)date_range,尤其是在處理時間序列數(shù)據(jù)時,這個函數(shù)的作用就是產(chǎn)生一個##DatetimeIndex,就是時間序列數(shù)據(jù)的索引

dates = pd.date_range('20130101', periods=6) 

# periods:表示你要從這個函數(shù)產(chǎn)生多少個日期索引值

dates 

DatetimeIndex(['2013-01-01', '2013-01-02', '2013-01-03', '2013-01-04',

'2013-01-05', '2013-01-06'],

dtype='datetime64[ns]', freq='D')

df = pd.DataFrame(np.random.randn(6,4), index=dates, columns=list('ABCD'))

print(df)

 ABCD
2013-01-01-0.747037-0.6659330.506150-0.047263
2013-01-02-0.5010750.8436470.506725-0.499766
2013-01-03-1.1714450.8164340.761552-0.908022
2013-01-04-0.226046-0.4727653.0757161.063544
2013-01-050.108281-0.122184-0.011140-1.287596
2013-01-06-1.499848-0.4302672.074067-1.067155

df1 = pd.DataFrame(np.random.randn(6,4), index=['a','b','c','d','e','f'], columns=list('ABCD'))

df1

Out[14]:

 ABCD
a-1.6369000.9667560.742416-1.163262
b0.035832-0.9605780.2531730.165655
c-1.0324650.2701601.4454540.598161
d2.112374-0.890787-0.308986-1.187998
e-1.834906-1.9398690.924308-1.150917
f0.1485562.4105710.083520-2.209039

df.head()

Out[9]:

 ABCD
2013-01-01-0.5428352.6400711.2442491.613720
2013-01-020.2702100.238108-1.111091-0.700783
2013-01-03-0.681126-1.618220-0.2215470.379695
2013-01-04-0.490011-0.3015521.951446-0.074140
2013-01-05-0.5499300.558058-0.0150880.092985

df.tail() #默認是5行

Out[11]:

 ABCD
2013-01-020.2702100.238108-1.111091-0.700783
2013-01-03-0.681126-1.618220-0.2215470.379695
2013-01-04-0.490011-0.3015521.951446-0.074140
2013-01-05-0.5499300.558058-0.0150880.092985
2013-01-060.761844-0.9381380.065372-0.677193

df.tail(3) #查看后3行

Out[12]:

 ABCD
2013-01-04-0.490011-0.3015521.951446-0.074140
2013-01-05-0.5499300.558058-0.0150880.092985
2013-01-060.761844-0.9381380.065372-0.677193

df.columns#df的列名

Out[13]:

Index(['A', 'B', 'C', 'D'], dtype='object')

df.describe()#統(tǒng)計性描述分析

Out[14]:

 ABCD
count6.0000006.0000006.0000006.000000
mean-0.2053080.0963880.3188900.105714
std0.5833781.4745871.0985680.853820
min-0.681126-1.618220-1.111091-0.700783
25%-0.548156-0.778992-0.169932-0.526430
50%-0.516423-0.0317220.0251420.009422
75%0.0801550.4780710.9495300.308018
max0.7618442.6400711.9514461.613720

df.T#轉(zhuǎn)置

 2013-01-01 00:00:002013-01-02 00:00:002013-01-03 00:00:002013-01-04 00:00:002013-01-05 00:00:002013-01-06 00:00:00
A-0.5428350.270210-0.681126-0.490011-0.5499300.761844
B2.6400710.238108-1.618220-0.3015520.558058-0.938138
C1.244249-1.111091-0.2215471.951446-0.0150880.065372
D1.613720-0.7007830.379695-0.0741400.092985-0.677193

df.sort_index(axis=1, ascending=False) #以列降序排列

DCBA 
2013-01-011.6137201.2442492.640071-0.542835
2013-01-02-0.700783-1.1110910.2381080.270210
2013-01-030.379695-0.221547-1.618220-0.681126
2013-01-04-0.0741401.951446-0.301552-0.490011
2013-01-050.092985-0.0150880.558058-0.549930
2013-01-06-0.6771930.065372-0.9381380.761844

df.sort_values(by='B') ##按B列的值來排序,默認是升序

ABCD 
2013-01-03-0.681126-1.618220-0.2215470.379695
2013-01-060.761844-0.9381380.065372-0.677193
2013-01-04-0.490011-0.3015521.951446-0.074140
2013-01-020.2702100.238108-1.111091-0.700783
2013-01-05-0.5499300.558058-0.0150880.092985
2013-01-01-0.5428352.6400711.2442491.613720

后續(xù)會持續(xù)更新,歡迎大家進群一起學(xué)習(xí),一起溝通。

1850000767f484c9d6d3?

數(shù)據(jù)分析群


發(fā)表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發(fā)表
主站蜘蛛池模板: 武宣县| 广州市| 都匀市| 辛集市| 璧山县| 镇平县| 柳林县| 衢州市| 江阴市| 黑水县| 特克斯县| 穆棱市| 普安县| 澜沧| 德令哈市| 竹北市| 虹口区| 江西省| 多伦县| 定兴县| 全州县| 宕昌县| 谷城县| 昔阳县| 灵川县| 都江堰市| 长岛县| 裕民县| 平湖市| 怀远县| 海盐县| 囊谦县| 武宣县| 吐鲁番市| 申扎县| 昌图县| 河北省| 普兰县| 米泉市| 绥阳县| 廉江市|