ZoneSpider Day1

其他 2020-02-29 23:17:30 阅读次数: 0

Day1

今天继续摸网页结构，我才发现关于那个获取信息的url的所有信息全在chrome F12里面有解释QAQ。
这是需要的header，似乎需要修改的只有cookies和path。path的内容下面有具体解释。

然后就是request的结构。

网页结构摸清楚后，就是构造session然后获得数据。
数据爬下来有点恶心，不规范的jsonp。把我搞了好久。它不仅有jsonp的头，还"key":"val"的key不加引号，解析全报错。最后问了万能群友，用了demjson解析，效率低下，但是可以用了
去头代码如下：

def loads_jsonp(_jsonp):
    try:
        return demjson.decode(re.match(".*?({.*}).*", _jsonp, re.S).group(1))
    except:
        raise ValueError('Invalid Input')

总算解析出字典了QAQ。今天就差不多这些了，明天就正式开始写HTML解析和数据统计了

猜你喜欢

转载自www.cnblogs.com/BeyondStars/p/12386857.html

ZoneSpider Day1

ZoneSpider开发 Day0

day1 1

DAY1 练习

Postman（day1）

HTML的day1

Day1

ios day1

PHP day1

play day1

Tornado day1

day1 登录

flask - day1

Hadoop day1

dp day1

Python day1

集训Day1

QT——day1

伦敦Day1

JAVA day1

day1~~~HTML

day1 作业，

oracle Day1

【LeetCode】day1

JavaWeb Day1

django day1

vue day1

Mysql day1

day1 作业

html day1

今日推荐

技术解析 GPT-4o：即时语音交互的突破与 GenAI 发展策略

开源大模型与闭源大模型

微信小程序授权登录获取用户的openid

亿级流量系统架构设计与实战

人工智能时代的程序设计教学与课程设计

纽交所技术问题致伯克希尔 (BRK.A) 显示跌近 100%

探索 api.maynor1024.live：一站式 AI 服务平台

AI一键去衣技术：窥见深度学习在图像处理领域的革命(最后有彩蛋)

艾体宝案例 | 使用Redis和Spring Ai构建rag应用程序

Apple M1 vs 高通8Gen2 vs Apple A12Z各方面比较

【升职加薪必备架构图】Springboot学习路线汇总_springboot四层架构流程图

与Apollo共创生态：Apollo7周年大会自动驾驶生态利剑出鞘

周排行

tensorflow 笔记：二（北大）

fork函数详解

unity单利模板

mac下的特殊键位指引（转自apple）

c语言入门-注释

Python--多任务[线程，进程，协程]

深度对抗学习在图像分割和超分辨率中的应用

【转】【Maven】Project configuration is not up-to-date with pom.xml错误解决方法

基本数据类型与常量池

部署自己的Intell项目的经历

每日归档

更多

2024-06-07(0)

2024-06-06(0)

2024-06-05(0)

2024-06-04(10)

2024-06-03(52)

2024-06-02(4)

2024-06-01(60)

2024-05-31(47)

2024-05-30(4)

2024-05-29(65)