国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

python3.X 抓取火車票信息【修正版】

2020-02-15 21:56:11
字體:
來源:轉載
供稿:網友

代碼是在源代碼的基礎上進行的修改。希望對你有所幫助!

 實現后如圖所示:

首先我們需要抓取一些基礎的數據,各大火車站信息!

import urllibfrom urllib import requestimport reurl = 'https://kyfw.12306.cn/otn/resources/js/framework/station_name.js?station_version=1.8955'req = urllib.request.Request(url)r = urllib.request.urlopen(req).read().decode('utf-8')stations = re.findall(r'([/u4e00-/u9fa5]+)|([A-Z]+)', r)stations = dict(stations)stations = dict(zip(stations.keys(),stations.values()))

上面的代碼通過抓取,網頁信息,返回一個字典數據:

   stations = dict(zip(stations.keys(),stations.values()))#這行代碼在后面進行了建值互換,這里沒有進行過修改,這是原文的數據。

火車站的數據抓取成功,我們接下來抓取查詢數據,代碼如下:

from station import stationsimport warningsdef change_date(d1) :  if '.' in d1 :    d1 = d1.replace('.', '-')  if not d1.startswith('0') :    d1 = str(0) + d1  if '-' in d1[-2] :    d1 = d1[:-1] + '0' + d1[-1]  return d1def student_or_not(student) :  if 'y' in student[0].lower() :    return '0X00'  else :    return 'ADULT'f1 = input('請輸入開始城市:/n')f = stations[f1]t1 = input('請輸入目的城市:/n')t = stations[t1]d1 = input('請輸入出發時間:/n')d = str('2018-') + change_date(d1)student = input('是否為學生票,輸入(yes/no)')print('正在查詢' + f1 + '至' + t1 + '的列車,請聽聽音樂......')url = 'https://kyfw.12306.cn/otn/leftTicket/query?leftTicketDTO.train_date=iwvjtn8m0&leftTicketDTO.from_station={f}&leftTicketDTO.to_station={t}&purpose_codes={student}'url = url.format(f=f, d=d, t=t, student=student_or_not(student))warnings.filterwarnings("ignore")

這里本人增加了兩個函數 change_date() 和 student_or_not()

 change_date() 這個函數對用戶輸入日期的行為進行了簡化,提高了用戶體驗,可以直接輸入比如7.3這樣的日期,其他的符號,我們可以自己進行擴展。

student_or_not() 這個函數的作用是判斷查詢的是普通票還是學生票

美化顯示,區分到站和出發站點的顏色,我們加入如下函數

def colored(color, text) :  table = {    'red'  : '/033[91m',    'green' : '/033[92m',    'nc'  : '/033[0m'  }  cv = table.get(color)  nc = table.get('nc')  return ''.join([cv, text, nc])

最后我們進行數據處理展示:

import requestsfrom get_urltrain import urlfrom prettytable import PrettyTablefrom color_set import coloredfrom station import stationsdef chair_lists(row_list) :  chair_list = []  for i in range(len(row_list) - 5, 21, -1) :    if row_list[i] != '' :      chair_list.append(row_list[i])    else :      chair_list.append('--')  return chair_listheaders = {  'user-agent' : 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/62.0.3202.62 Safari/537.36'}r = requests.get(url, verify=False, headers=headers) # 請求網址1的內容rows = r.json()['data']['result'] # 將內容解析為列表trains = PrettyTable()trains.field_names = ["車次", "車站", "時間", "歷時", "商務座/特等座", "一等座", "二等座", "高級軟臥", "軟臥", "動臥", "硬臥 ", "軟座 ", "硬座", "無座",           "其他"]# 設置table的headernum = len(rows) # 打印列表的個數# station1 = dict([v, k] for k, v in stations.items())station_list = dict(zip(stations.values(), stations.keys()))for row in rows : # 列表循環  row_list = row.split('|')  chair_list = chair_lists(row_list)  trains.add_row([row_list[3],          '/n'.join([colored('green', station_list[row_list[6]]),                colored('red', station_list[row_list[7]])]),          '/n'.join([colored('green', row_list[8]),                colored('red', row_list[9])]),          row_list[10],          ] + chair_list)print('查詢結束,共有 %d 趟列車。' % num) # 列表個數也就是列車個數print(trains)            
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 大同市| 武清区| 喀什市| 灵台县| 迁安市| 伊宁县| 西昌市| 北票市| 英德市| 肥乡县| 长泰县| 高密市| 马公市| 易门县| 乌拉特中旗| 凭祥市| 周口市| 沈阳市| 环江| 越西县| 克什克腾旗| 浙江省| 威海市| 积石山| 平远县| 内丘县| 健康| 吉林省| 定兴县| 湾仔区| 沁源县| 卓资县| 阿拉善右旗| 东乌珠穆沁旗| 会昌县| 秦皇岛市| 新密市| 大兴区| 永安市| 北碚区| 金昌市|