python爬虫学习（五）药监局化妆品生产许可 - 代码天地

python爬虫学习（五）药监局化妆品生产许可

其他 2020-03-26 15:04:33 阅读次数: 0

这里面有几个坑，网页url是http://125.35.6.84:81/xk/
模拟访问之后只有首页标题，没有数据
然后发现是用了ajax，重新找到url
第二个坑是这个url的数据也不是最终数据只是个统计数据
通过这个url拿到下个url的id再去访问最终的数据

# -*- coding: utf-8 -*-
import requests
import json
if __name__ == '__main__':
    #批量获取企业id
    url = 'http://125.35.6.84:81/xk/itownet/portalAction.do?method=getXkzsList'
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.87 Safari/537.36'
    }
    id_list = []  # 存储企业id
    all_data_list = []  # 存储所有的企业详情数据

    for page in range(1,6):
        page = str(page)
        data={
            'on': 'true',
            'page': page,                #页数
            'pageSize': '15',
            'productName':'',
            'conditionType': '1',
            'applyname':'',
            'applysn':''
        }
        json_ids=requests.post(url=url,headers=headers,data=data).json()
        for dic in json_ids['list']:
           id_list.append( dic['ID'])

    #获取企业详情数据
    post_url = 'http://125.35.6.84:81/xk/itownet/portalAction.do?method=getXkzsById'
    for id in id_list:
        data={
            'id':id
        }
        detail_json=requests.post(url=post_url,headers=headers,data=data).json()
       # print(detail_json,'--------结束')
        all_data_list.append(detail_json)
    #储存到本地
    fp = open('./allData.json','w',encoding='utf-8')
    json.dump(all_data_list,fp=fp,ensure_ascii=False)
    print('结束')

发布了23 篇原创文章 · 获赞 0 · 访问量 676

私信关注

猜你喜欢

转载自blog.csdn.net/haimian_baba/article/details/103713089

python爬虫学习（五）药监局化妆品生产许可

爬虫练习项目--化妆品生产许可信息管理系统服务平台

解析国家药监局化妆品公司许可信息

Python爬取CFDA化妆品生产信息

1-6 requests模块之爬取化妆品生产许可证

爬取NMPA化妆品生产许可信息数据，保存到excel中（requests初体验）

化妆品Cosmetics

化妆品生产追溯系统，让女神放心美丽

requests爬取国家药监总局中基于中华人民共和国化妆品生产许可证相关数据

褚时健走了，他的思想给了化妆品生产管理者哪些启发？

食疗排除化妆品的铅汞毒

django 王中王5之化妆品

化妆笔记丨1 化妆品概说

springboot化妆品网上商城含后台管理java化妆品商城源码

利用 Python 分析了某化妆品企业的销售情况，我得出的结论是？

Python爬取国家药监总局化妆品详细信息

护肤品和化妆品的意大利文表达

畅销全球30年的经典化妆品

老中医化妆品是品牌吗

业务：某化妆品公司商业模式

化妆品追溯管理系统开发

化妆品区块链溯源，守护你的美

jsp ssh日韩化妆品商城购物系统

用Python全面分析某化妆品企业销售情况，可视化图显示数据

[小程序模板] 化妆品商城小程序模板商城APP模板化妆品商城小程序前端源码+免费分享

《2023年化妆品原料成分趋势报告》| 解码化妆品备案数据，洞悉2023年潜力原料成分

日本化妆品公司佳丽宝宣布召回54种产品

四：后台数据库设计（化妆品表格）

按压式化妆品护发素瓶子包装Vi样机贴图教程

伽蓝集团郑春颖：以化妆品业为突破口助推“上海购物”

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)