国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

Python分析學校四六級過關情況

2020-02-16 10:48:42
字體:
來源:轉載
供稿:網友

這段時間看了數據分析方面的內容,對Python中的numpy和pandas有了最基礎的了解。我知道如果我不用這些技能做些什么的話,很快我就會忘記。想起之前群里發過一個學校的四六級成績表,正好可以用來熟悉一下pandas中的一些用法。

1.數據介紹。

成績表中包含的字段十分詳細,里面有年級、性別、姓名、分數等等的一系列內容,我只想簡單的分析一下我們學校的四六級過關率而已,所以去除了一些不必要的字段。留下的有如下幾個字段:

第一列是自增的序號,沒有什么實際意義。

第二列就是代表著該學生參加的是四級還是六級。

第三列是我們學校的院系名稱。

第四列是學校院系的各個專業。

第五列是年級,13代表著2013年入學。

第六列是性別。

后面的三列分別是總分、聽力、閱讀、寫作等。

其中總分為0的都是缺考的。一共有接近9000條數據(沒有報名的不在其中)。

2.預期結果。

我想利用這些數據最終通過圖標的形式展示出以下幾點:

1.各個學院的四六級平均分。

2.各個學院的四六級過關人數。

3.各個學院的各個年級過關人數。

4.各個年級的過關人數。

5.男生女生分別過關人數。

最終結果:

各個學院的四六級過關人數:

3.實現過程。

(1)導入依賴包。

程序分別使用了pandas進行分組轉換,和matplotlib提供的繪圖功能。

import pandas as pdimport matplotlib.pylab as plt

(2)加載數據。

想要分析數據自然要得到數據了,我將整理的數據存放在sj.xls中,是一個Excel類型的數據。
這一步使用pandas的read_excel即可,生成一個DataFrame對象。

#加載全部數據sj = pd.read_excel(r'F:/DataAnalysis/sj.xls')

加載完之后輸出一下看看內容:

除了排版沒有對齊之外其他都一樣。

(3)統計各個學院平均分。

在這里就可以完成我們預期的第一個結果:

各個學院的四六級平均分:

想要各個學院的情況當然是要根據學院來進行分組了,同時也需要分出“CET4”和“CET6”兩組。使用groupby即可,這樣會生成一個SeriesGroupBy對象,然后再調用mean函數(默認是軸0計算,也就是我們想要的結果)即可統計出平均分情況。

#按照各個學院進行分組xymean = sj['總分'].groupby([sj['院系名稱'],sj['語言級別']])#計算各個學院的平均分數xymean = xymean.mean()            
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 高阳县| 宣恩县| 德保县| 鄂州市| 香河县| 化德县| 珠海市| 特克斯县| 莆田市| 固安县| 车致| 榆社县| 三明市| 元氏县| 延庆县| 龙州县| 宁津县| 阆中市| 文水县| 当阳市| 深州市| 隆子县| 富顺县| 东明县| 资中县| 濉溪县| 获嘉县| 东城区| 西吉县| 巴林右旗| 商都县| 手游| 宜兰县| 颍上县| 成安县| 清河县| 浦东新区| 龙南县| 车险| 佛坪县| 祁东县|