python爬取食药监局企业信息 - 代码天地

python爬取食药监局企业信息

其他 2020-04-02 15:11:48 阅读次数: 0

import requests
import json

if __name__ == '__main__':
    headers = {
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.122 Safari/537.36'
    }
    url = 'http://125.35.6.84:81/xk/itownet/portalAction.do?method=getXkzsList'

    id_list = []  # 存储页面的所有企业id
    info_list = []  # 存储所有企业的详细信息对象
    for page in range(1,137):
        page=str(page)
        param ={
            'on': 'true',
            'page': page,
            'pageSize': '15',
            'productName':'',
            'conditionType': '1',
             'applyname':'',
             'applysn':''
        }
        data_obj = requests.post(url=url,data=param,headers=headers).json()
        #提取json中的指定部分内容，此处为id
        for obj in data_obj['list']:
            id_list.append(obj['ID'])

    url = 'http://125.35.6.84:81/xk/itownet/portalAction.do?method=getXkzsById'
    for id in id_list:
        param={
                'id':id
        }
        cur_obj = requests.post(url=url, data=param, headers=headers).json()
        print('公司名称：' + cur_obj["epsName"] + ' 法人: ' + cur_obj["legalPerson"] + "地址：" + cur_obj["epsAddress"])
        info_list.append(cur_obj)


  #  fp = open("食药监局所有企业的详细信息.json",'w',encoding='utf-8')
   # json.dump(info_list,fp=fp,ensure_ascii=False)

    print("爬取完成！")

发布了97 篇原创文章 · 获赞 42 · 访问量 12万+

私信关注

猜你喜欢

转载自blog.csdn.net/LVGAOYANH/article/details/104617735

python爬取食药监局企业信息

Python爬虫框架Scrapy爬取企业信息

基于Python爬取天眼查网站的企业信息

爬取企查查企业信息

基于Python爬取天眼查网站的企业信息!Python无所不能！

python爬虫 request+lxml爬取黄页88网企业信息

抖抖代码-爬取企查查企业信息

爬取企业信息-企业信用信息查询系统-天眼查爬虫

大数据信息资料采集:美国财富500强企业信息资料采集爬取

帮同学爬取某官方公众号的众多企业信息

这是一个爬虫—爬取天眼查网站的企业信息

企业信息调查

企业信息

企业信息安全————1、什么是企业信息安全

企业信息安全浅析

企业信息安全实践

python 爬取淘宝信息

python爬取股票信息

python爬取天气信息

python爬取网页信息

Python爬取电影信息

Python|爬取书籍信息

Python爬取租房信息

python爬虫（selenium）实现对T眼查企业工商历史变更信息的爬取

python爬取企业登记业务

python爬取京东python书籍信息

企业信息安全的管理与防范

企业信息化咨询

groovy爬虫练习之——企业信息

企业信息管理系统

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)