doraemon的python 爬虫示例1（入门）动态数据的爬取 - 代码天地

doraemon的python 爬虫示例1（入门）动态数据的爬取

其他 2019-11-29 04:17:30 阅读次数: 0

数据来源某某总局

import requests
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'
}
fp = open('./yao.txt','w',encoding='utf-8')
# fp = open('./company_detail.txt','w',encoding='utf-8')

for page in range(1,2):
    url = 'http://125.35.6.84:81/xk/itownet/portalAction.do?method=getXkzsList'
    data = {
        'on': 'true',
        'page': str(page),
        'pageSize': '15',
        'productName': '',
        'conditionType': '1',
        'applyname': '',
        'applysn': '',
    }
# 就是访问这个网站的时候，所需要携带的参数，英文是post请求，所以是data
    
#         data = {
#         'on': 'true',
#         'page': str(page),
#         'pageSize': '15',
#         'productName': '',
#         'conditionType': '1',
#         'applyname': '',
#         'applysn': '',
#     }

#     data_dic = requests.post(url=url,data=data,headers=headers).json()
    data_dic = requests.post(url=url,data=data,headers=headers).json()
#     print(data_dic)
    for dic in data_dic['list']:
        _id = dic['ID']
        post_url = 'http://125.35.6.84:81/xk/itownet/portalAction.do?method=getXkzsById'
        post_data={'id':_id}
        detail_dic = requests.post(url=post_url,data=post_data,headers=headers).json()
               
        company_title = detail_dic['epsName']
        address = detail_dic['epsProductAddress']

        fp.write(company_title+':'+address+'\n')
        print(company_title,'爬取成功!!!')               
                                 
fp.close() 

总结：如果那里出错，当前语句没有错误，那么最好向上看代码

猜你喜欢

转载自www.cnblogs.com/doraemon548542/p/11955172.html

doraemon的python 爬虫示例1（入门）动态数据的爬取

doraemon的python centos的入门

doraemon的python 爬虫（requests模块）

doraemon的python 数据库1

doraemon的python 爬虫 http和https的区别

doraemon的python 爬虫（数据解析——正则、bs4、xpath）

doraemon的python js入门必了解之一

doraemon的python centos的入门（一）增删改查命令

doraemon的python 数据库2和pymysql

doraemon的python 提升爬取效率（单线程+多任务异步协程）

doraemon的python centos的入门（五）用户和用户组权限

doraemon的python centos的入门（四）查询和压缩文件、文件夹

doraemon的python之旅整型、布尔值和字符串1

python ：通过爬虫爬取数据（1）

doraemon的python 练习

doraemon的python 列表

doraemon的python 模块

doraemon的python 池

doraemon的python 线程详解

doraemon的python jquery

doraemon的python 协程

Python爬虫之爬取动态页面数据

python爬虫爬取简单的动态数据-异步加载问题

python爬虫入门（1）简单爬取网页源码

python爬虫-基础入门-爬取整个网站《1》

Python爬虫（入门+进阶）学习笔记 1-8 使用自动化神器Selenium爬取动态网页（案例三：爬取淘宝商品）

doraemon的python 栈、约束、反射

doraemon的python datetime和补充

Python爬虫-视频爬取示例

Python爬虫入门【3】：美空网数据爬取

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)