国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

Python運用于數據分析的簡單教程

2020-02-23 00:27:56
字體:
來源:轉載
供稿:網友

最近,Analysis with Programming加入了Planet Python。作為該網站的首批特約博客,我這里來分享一下如何通過Python來開始數據分析。具體內容如下:

    數據導入
        導入本地的或者web端的CSV文件;
    數據變換;
    數據統計描述;
    假設檢驗
        單樣本t檢驗;
    可視化;
    創建自定義函數。

數據導入

這是很關鍵的一步,為了后續的分析我們首先需要導入數據。通常來說,數據是CSV格式,就算不是,至少也可以轉換成CSV格式。在Python中,我們的操作如下:

import pandas as pd # Reading data locallydf = pd.read_csv('/Users/al-ahmadgaidasaad/Documents/d.csv') # Reading data from webdata_url = "https://raw.githubusercontent.com/alstat/Analysis-with-Programming/master/2014/Python/Numerical-Descriptions-of-the-Data/data.csv"df = pd.read_csv(data_url)

為了讀取本地CSV文件,我們需要pandas這個數據分析庫中的相應模塊。其中的read_csv函數能夠讀取本地和web數據。

數據變換

既然在工作空間有了數據,接下來就是數據變換。統計學家和科學家們通常會在這一步移除分析中的非必要數據。我們先看看數據:

# Head of the dataprint df.head() # OUTPUT Abra Apayao Benguet Ifugao Kalinga0 1243 2934  148 3300 105531 4158 9235  4287 8063 352572 1787 1922  1955 1074  45443 17152 14501  3536 19607 316874 1266 2385  2530 3315  8520 # Tail of the dataprint df.tail() # OUTPUT  Abra Apayao Benguet Ifugao Kalinga74 2505 20878  3519 19737 1651375 60303 40065  7062 19422 6180876 6311 6756  3561 15910 2334977 13345 38902  2583 11096 6866378 2623 18264  3745 16787 16900

對R語言程序員來說,上述操作等價于通過print(head(df))來打印數據的前6行,以及通過print(tail(df))來打印數據的后6行。當然Python中,默認打印是5行,而R則是6行。因此R的代碼head(df, n = 10),在Python中就是df.head(n = 10),打印數據尾部也是同樣道理。

在R語言中,數據列和行的名字通過colnames和rownames來分別進行提取。在Python中,我們則使用columns和index屬性來提取,如下:

# Extracting column namesprint df.columns # OUTPUTIndex([u'Abra', u'Apayao', u'Benguet', u'Ifugao', u'Kalinga'], dtype='object') # Extracting row names or the indexprint df.index # OUTPUTInt64Index([0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78], dtype='int64')            
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 石景山区| 鄱阳县| 博兴县| 怀仁县| 宜川县| 水富县| 广河县| 敦化市| 奈曼旗| 乐至县| 策勒县| 越西县| 平原县| 白城市| 三门县| 庆元县| 奎屯市| 六安市| 湘西| 定陶县| 伽师县| 江源县| 龙陵县| 保康县| 孝义市| 弋阳县| 通化市| 华蓥市| 西青区| 西乌珠穆沁旗| 贵港市| 策勒县| 拜城县| 上思县| 许昌县| 宜兰县| 任丘市| 瓦房店市| 寿阳县| 兴业县| 乌鲁木齐市|