python爬虫高铁12306余票爬取 - 代码天地

python爬虫高铁12306余票爬取

编程语言 2020-01-12 10:05:04 阅读次数: 0

import requests
import pandas as pd
import arrow
import json
import os
from itertools import combinations
os.chdir(r'C:/Users/Windows/Desktop')

class HighSpeed(object):
    def __init__(self,date,from_station,to_station):
        self.date = date
        self.from_station = from_station
        self.to_station = to_station

    def get_pd(self):
        headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko)Chrome/80.0.3970.5 Safari/537.36'}
        r = requests.get('https://www.12306.cn/kfzmpt/lcxxcx/query?purpose_codes=ADULT&queryDate='+self.date+'&from_station='+self.to_station+'&to_station='+self.from_station, headers = headers).text
        return r

    def to_csv(self):
        js = self.get_pd()
        js2 = json.loads(js)
        try:
            data = js2['data']['datas']
            dt_data = pd.DataFrame(data)
            tm = arrow.now().format('HH:mm')
            dt_data['记录时间'] = tm

            dt_data.to_csv(self.date + 'test.csv',encoding = 'gbk',mode = 'a',index = False)
        except:
            print('empty')


if __name__ == '__main__':
    cheng_yu = ['ICW','JOW','FYW','WZW','NKW','NWW','RQ','FQW','WMW','FZW','CYW','CQW','DYW','MYW','NIW','NCW','MSW','YBW','VJW','RXW']
    com = combinations(cheng_yu,2)
    com_use = []
    for x in com:
        com_use.append(x)
    for i in range(12,13):                      #注意时间的修改
        date = '2020-01-{}'.format(str(i))
        for ls in com_use:
            hspeed = HighSpeed(date,ls[0],ls[1])
            hspeed.to_csv()

    print('finished!')

之前没有找到12306的这个接口，大于20张余票的都显示有，这个网址居然还是可以显示完全，而且良心的是爬取获得的数据直接就是json数据都不需要进行清洗，非常方便！

刘润达

发布了19 篇原创文章 · 获赞 0 · 访问量 883

私信关注

猜你喜欢

转载自blog.csdn.net/weixin_44056948/article/details/103943048

python爬虫高铁12306余票爬取

python 3爬取 12306余票

python3爬取12306余票，自动抢票

爬虫实战：使用requests库爬取12306余票信息

python 3 爬取12306余票:升级版-----图形化界面

使用java如何爬取12306的余票信息？

Python：爬虫助你回家，12306余票监测！

运用爬虫爬取12306车票信息

python骚操作-爬取12306车票信息！

Python爬取12306车票信息

【Python】实现12306余票监控

python 3 12306余票查询脚本

python爬取12306

python爬虫十五：爬取12306火车票信息

Crawler：Python之Crawler爬取12306网站来实现快速抢票

Python爬取12306车票信息进阶日志版

Python爬虫实战：12306抢票开源！

python 爬取12306数据

使用Python 3编写12306余票查询脚本

python3 实现12306查询余票

12306余票及票价查询

爬取12306车票信息（初级版本）

python爬虫——爬取淘票票正在热映电影

12306余票查询(三)——获取余票票价

12306火车票爬虫处理“目前排队人数已经超过余票张数”

Python 爬取12306火车票

Python 12306抢票

12306抢票（python）

Python爬虫实战之12306抢票开源

潭州学院Python爬虫12306抢票实战

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)