异步加载的几种破解方法

什么是异步加载,说白了,就是你在网址上看到的东西,它的源代码并没有那些东西,就例如以下网站http://exercise.kingname.info/exercise_ajax_1.html此地址来自Python爬虫开发 从入门到实战这本书中的
这就是典型的异步加载

在这里插入图片描述
我们查询一下它的源码
在这里插入图片描述
看看,并没有包含文本信息,如果我们简单的用爬虫爬取,会怎么样呢?
在这里插入图片描述
看,你根本看不到它的文本信息,那么,我们应该如何抓取呢?
我们先打开开发者工具,切换到Network
在这里插入图片描述
我们刷新一下试试
在这里插入图片描述
你会发现,多出来了一点东西,我们先点开ajax_1_backend
在这里插入图片描述
诶,你会发现这里面居然包含了你想要的文本信息
我们再点开ajax_1_postbackend
在这里插入图片描述
这里也有文本信息。
我们再打开ajax_1_backend里的Headers、
在这里插入图片描述
看看这一段,既然请求是这个地址的,那我们打开这一段地址看看
在这里插入图片描述
看看,数据就出来了,我们用Python代码写一下
在这里插入图片描述
就是这么简单.
我们再看到第二条信息
在这里插入图片描述
诶,我们可以看到,这个是以POST方式向这个http://exercise.kingname.info/ajax_1_postbackend发的信息,并以JSON格式提交数据,那我们接着写代码
在这里插入图片描述
我们以JSON的方式向它传递了两个信息,一个是name,一个是age

发布了2 篇原创文章 · 获赞 12 · 访问量 967

猜你喜欢

转载自blog.csdn.net/weixin_42578981/article/details/105021870