python學(xué)習(xí)[3]_按日期分割數(shù)據(jù)集

2019-11-06 07:27:05

字體：大中小

來源：轉(zhuǎn)載

供稿：網(wǎng)友

按日期分割數(shù)據(jù)集

-1、首先我這里的數(shù)據(jù)集，形式如下圖：這里寫圖片描述

這里可以看見第一行為數(shù)據(jù)的屬性，最后一個為時間，格式為.csv文件，我希望按日期（年月日）劃分出數(shù)據(jù)，即按天將數(shù)據(jù)分割出來。

2、由于數(shù)據(jù)集較大，因次需要導(dǎo)入pandas，利用pandas將csv文件導(dǎo)入到Python中。

3、假設(shè)導(dǎo)入的變量為d，那么2014年11月18號這天的數(shù)據(jù)即可以這樣截取：d[d[‘time’].str.contains(r’2014-11-18’)]

4、最后再將結(jié)果導(dǎo)出為csv文件即可。

import pandasd = pandas.read_csv('d1828.csv')d1118=d[d['time'].str.contains(r'2014-11-18')]d1119=d[d['time'].str.contains(r'2014-11-19')]d1120=d[d['time'].str.contains(r'2014-11-20')]d1121=d[d['time'].str.contains(r'2014-11-21')]d1122=d[d['time'].str.contains(r'2014-11-22')]d1123=d[d['time'].str.contains(r'2014-11-23')]d1124=d[d['time'].str.contains(r'2014-11-24')]d1125=d[d['time'].str.contains(r'2014-11-25')]d1126=d[d['time'].str.contains(r'2014-11-26')]d1127=d[d['time'].str.contains(r'2014-11-27')]d1128=d[d['time'].str.contains(r'2014-11-28')]d1118.to_csv('d1118.csv')d1119.to_csv('d1119.csv')d1120.to_csv('d1120.csv')d1121.to_csv('d1121.csv')d1122.to_csv('d1122.csv')d1123.to_csv('d1123.csv')d1124.to_csv('d1124.csv')d1125.to_csv('d1125.csv')d1126.to_csv('d1126.csv')d1127.to_csv('d1127.csv')d1128.to_csv('d1128.csv')

5、這里d1828.csv文件中含有18號到28號的日期，因此最后導(dǎo)出的文件是2014年11月18號到2014年12月28號的文件。

6、同理，當(dāng)?shù)玫侥骋惶斓臄?shù)據(jù)后，如果還想繼續(xù)按時間（即小時）劃分，也是同樣的方法。用pandas進(jìn)行較大數(shù)據(jù)處理時，速度也很快。

上一篇：Python之matplotlib

下一篇：python基礎(chǔ)系列(五)之閉包