国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

Python進行數據科學工作的簡單入門教程

2020-02-23 00:28:16
字體:
來源:轉載
供稿:網友

Python擁有著極其豐富且穩定的數據科學工具環境。遺憾的是,對不了解的人來說這個環境猶如叢林一般(cue snake joke)。在這篇文章中,我會一步一步指導你怎么進入這個PyData叢林。

你可能會問,很多現有的PyData包推薦列表怎么樣?我覺得對新手來說提供太多的選擇可能會受不了。因此這里不會提供推薦列表,我要討論的范圍很窄,只集中于10%的工具,但它們可以完成你90%的工作。當你掌握這些必要的工具后,你就可以瀏覽PyData工具的長列表了,選擇自己接下來要使用的。

值得一提的是,我介紹的這幾個工具可以讓你完成一個數據科學家日常的絕大部分工作了(比如數據輸入輸出、數據再加工以及數據分析)。
安裝

經常會有人過來和我說“我聽說Python很擅長處理數據科學,所以我想學一下。但是安裝Python和所有其他模塊就耗費了兩天時間”。安裝Python是很合理的,因為你要用它,但是當你不知道真正需要哪些其他工具時就手動安裝所有的PyData工具,這確實是一項大工程啊。所以我強烈反對這樣做。

幸運的是,Continuum的一伙人創建了Python發行版Anaconda,它包含了大部分PyData工具包。默認沒有的模塊也可以輕松地通過GUI安裝。這個發行版適用于所有主流平臺。這樣無需耗費兩天安裝了,可以直接使用它。
IPython Notebook

Python安裝后,大部分人直接啟動并開始學習。這很合理,但遺憾的是又大錯特錯了。我沒見過直接在Python命令行中運行Python科學計算環境的(因人而異)。相反,可以使用IPython,特別是IPython Notebook,它們都是特別強大的Python shell,被廣泛地使用在PyData領域中。我強烈建議你直接使用IPython Notebook(IPyNB)而不用為其他事所煩擾,你不會后悔的。簡而言之,IPyNB是一個通過瀏覽器訪問的Python shell。它允許你混合編輯代碼、文本和圖形(甚至是交互對象)。本文就是在IPyNB中完成的。在Python的會議中,幾乎所有的演講都使用IPython Notebook。Anaconda中預裝了IPyNB,可以直接使用。下面看下它是什么樣的:

In [1]:

print('Hello World')Hello World

IPyNB發展很快——每次在會議中聽(IPyNB的)核心開發人員演講時,我總被他們想出的新功能所震撼。要了解它的一些先進功能,可以看看下面這個關于IPython小工具的簡短教程。這些小工具可以讓你使用滑動條交互地控制繪圖:

In [1]:
 

from IPython.display import YouTubeVideoYouTubeVideo('wxVx54ax47s') # 沒錯,它也可以嵌入youtube視頻

Out[1]:
6. IPython Widgets – IPython Notebook Tutorial
Pandas

通常,大家會建議你先學習NumPy(讀作num-pie,不是num-pee),一個支持多維數組的庫。幾年前肯定得這樣,但現在我幾乎不使用NumPy。因為NumPy越來越成為一個被其他庫所使用核心庫,這些庫通常具有更優雅的接口。因此,Pandas成為了處理數據所主要使用的庫。它可以以各種格式(包括數據庫)輸入輸出數據、執行join以及其他SQL類似的功能來重塑數據、熟練地處理缺失值、支持時間序列、擁有基本繪圖功能和統計功能,等等還有很多。對它所有的特性來說,肯定有一個學習曲線,但我強烈去建議你先看一下大部分文檔。你所投入的時間將使你的數據再加工過程更高效,這會帶來上千倍的回報。這里有一些快速技巧會讓你胃口大開的:

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 两当县| 定州市| 宝兴县| 上林县| 洛阳市| 石棉县| 泸州市| 贵溪市| 黄平县| 榆社县| 长汀县| 广元市| 浪卡子县| 北安市| 六盘水市| 大厂| 沧州市| 象山县| 堆龙德庆县| 那坡县| 九龙城区| 孟连| 米易县| 临湘市| 哈巴河县| 德庆县| 台北县| 蒙城县| 泸州市| 清镇市| 佛山市| 曲松县| 北流市| 双峰县| 洞头县| 郴州市| 云南省| 万宁市| 遵义县| 河南省| 万宁市|