爬取肯德基餐厅信息（requests模块） - 代码天地

爬取肯德基餐厅信息（requests模块）

其他 2021-01-29 21:32:59 阅读次数: 0

首先打开肯德基餐厅主页，找到下面的餐厅查询点击进入。在这里插入图片描述
通过检查打开浏览器自带抓包工具。点击搜索我们发现页面只有局部刷新。那么此时应该是ajax请求了。那么此时我们通过抓包工具XHR里面的请求。然后我们查看该url，请求为post，携带的参数Form-Data。content-type为text文本类型。了解这些必备参数之后，我们就可以进行爬取数据了。在这里插入图片描述
通过调整 ‘keyword’: ‘’,
‘pageIndex’:’’,
‘pageSize’: ‘’,三个参数我们可以获取我们想要搜索的关键字，页面，页面长度。代码如下：

import requests
if __name__=="__main__":
    url ="http://www.kfc.com.cn/kfccda/ashx/GetStoreList.ashx?op=keyword"
    param={
    
    
            'cname':'',
            'pid':'',
            'keyword': '上海',
            'pageIndex':'2',
            'pageSize': '20',
    }
    headers = {
    
    
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.75 Safari/537.36 Edg/86.0.622.38'
    }
    response = requests.get(url=url, params=param, headers=headers)
    page_text = response.text
    print(page_text)
    # step4:持久化存储
    with open('./kendeji.txt', 'w', encoding="utf-8") as fp:
        fp.write(page_text)
    print("爬取数据结束")

通过对结果观察，这些数据符合json格式，可以使用[该网站]进行json校验格式化，来阅读。如图所示
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/qq_45701131/article/details/109314056

爬取肯德基餐厅信息（requests模块）

requests模块之爬取肯德基位置信息

requests-爬虫多页爬取肯德基餐厅位置

Python爬虫 - 爬取肯德基门店信息

【老男该】爬虫学习笔记P1-P18第一单元，第二单元，正则表达式，爬取肯德基餐厅查询：爬取豆瓣电影分类排行榜，破解百度翻译，爬取搜狗指定词条，爬取搜狗首页的页面数据，requests模块

爬虫2 requests+bs4爬汽车之家新闻, bs4的使用(遍历文档树和查找文档树), 搭一个免费的代理池, 验证码破解(超级鹰), 爬取糗事百科段子自动通过微信发给好友, 爬取(拉钩职位, cnblogs新闻, 红楼梦小说写入txt, 肯德基餐厅信息), 爬取博客园写入mysql

requests模块进行京东页面信息的爬取

爬取肯德基某地区所有门店信息

爬取全国所有必胜客餐厅信息

requests + pyquery 爬取 csdn 博客信息

requests + pyquery 爬取 csdn 博客信息

python的requests模块爬取网页内容

提升requests模块的爬取效率

requests模块之爬取豆瓣电影

requests模块爬取数据操作流程

路飞学城IT作业：抓取肯德基餐厅信息查询

python利用requests模块，实现爬取电影天堂最新电影信息。

全国315个城市，用python爬取肯德基老爷爷的店面信息

Python爬虫实战，requests+openpyxl模块，爬取手机商品信息数据（附源码）

Python爬虫实战，requests+parsel模块，爬取二手房房源信息数据

100 行代码爬取全国所有必胜客餐厅信息

爬取全国所有必胜客餐厅信息，只需要50行代码

python requests 爬取知乎用户信息

requests和re库爬取淘宝商品信息

requests+pyquery爬取csdn博客信息

python爬虫---实现项目(一) Requests爬取HTML信息

python requests爬取拉勾网职位信息

requests爬虫实战：某私募信息爬取

requests常用模块以及爬取github个人项目

Python爬虫——利用requests模块爬取妹子图

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)