按日期分割數(shù)據(jù)集
-1、 首先我這里的數(shù)據(jù)集,形式如下圖:
2、由于數(shù)據(jù)集較大,因次需要導(dǎo)入pandas,利用pandas將csv文件導(dǎo)入到Python中。
3、假設(shè)導(dǎo)入的變量為d,那么2014年11月18號這天的數(shù)據(jù)即可以這樣截取:d[d[‘time’].str.contains(r’2014-11-18’)]
4、最后再將結(jié)果導(dǎo)出為csv文件即可。
import pandasd = pandas.read_csv('d1828.csv')d1118=d[d['time'].str.contains(r'2014-11-18')]d1119=d[d['time'].str.contains(r'2014-11-19')]d1120=d[d['time'].str.contains(r'2014-11-20')]d1121=d[d['time'].str.contains(r'2014-11-21')]d1122=d[d['time'].str.contains(r'2014-11-22')]d1123=d[d['time'].str.contains(r'2014-11-23')]d1124=d[d['time'].str.contains(r'2014-11-24')]d1125=d[d['time'].str.contains(r'2014-11-25')]d1126=d[d['time'].str.contains(r'2014-11-26')]d1127=d[d['time'].str.contains(r'2014-11-27')]d1128=d[d['time'].str.contains(r'2014-11-28')]d1118.to_csv('d1118.csv')d1119.to_csv('d1119.csv')d1120.to_csv('d1120.csv')d1121.to_csv('d1121.csv')d1122.to_csv('d1122.csv')d1123.to_csv('d1123.csv')d1124.to_csv('d1124.csv')d1125.to_csv('d1125.csv')d1126.to_csv('d1126.csv')d1127.to_csv('d1127.csv')d1128.to_csv('d1128.csv')5、這里d1828.csv文件中含有18號到28號的日期,因此最后導(dǎo)出的文件是2014年11月18號到2014年12月28號的文件。
6、同理,當(dāng)?shù)玫侥骋惶斓臄?shù)據(jù)后,如果還想繼續(xù)按時間(即小時)劃分,也是同樣的方法。用pandas進(jìn)行較大數(shù)據(jù)處理時,速度也很快。
新聞熱點(diǎn)
疑難解答