[Python]爬取首都之窗百姓信件网址id python 2020.2.13 - 代码天地

[Python]爬取首都之窗百姓信件网址id python 2020.2.13

其他 2020-02-13 14:50:48 阅读次数: 0

经人提醒忘记发网址id的爬取过程了，

http://www.beijing.gov.cn/hudong/hdjl/com.web.consult.consultDetail.flow?originalId=AH20021300174

AH20021300174为要爬取的内容

现代码如下：

 1 import json
 2 import requests
 3 import io
 4 
 5 url="http://www.beijing.gov.cn/hudong/hdjl/com.web.search.mailList.mailList.biz.ext"
 6 
 7 kv = {
 8     'Host': 'www.beijing.gov.cn',
 9     'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:71.0) Gecko/20100101 Firefox/71.0',
10     'Accept': 'application/json, text/javascript, */*; q=0.01',
11     'Accept-Language': 'zh-CN,zh;q=0.8,zh-TW;q=0.7,zh-HK;q=0.5,en-US;q=0.3,en;q=0.2',
12     'Accept-Encoding': 'gzip, deflate',
13     'Content-Type': 'text/json',
14     'X-Requested-With': 'XMLHttpRequest',
15     'Content-Length': '155',
16     'Origin': 'http://www.beijing.gov.cn',
17     'Connection': 'keep-alive',
18     'Referer': 'http://www.beijing.gov.cn/hudong/hdjl/'}
19 
20 def page(begin):
21     query={
22     'PageCond/begin': begin,
23     'PageCond/isCount':'true',
24     'PageCond/length':6,
25     }
26     datas=json.dumps(query)
27     r=requests.post(url,data=datas,headers=kv)
28     print(r.status_code)
29     print(r.text)
30     js=json.loads(r.text)
31     for j in js["mailList"]:
32         print(j)
33         print(j.get("original_id"))
34 
35 
36 def href():
37     begin=0
38     for i in range(0,5584):
39         if i%6==0:
40             page(i)
41             #print(begin)
42 
43 if __name__=="__main__":
44     href()

猜你喜欢

转载自www.cnblogs.com/zlc364624/p/12303490.html

[Python]爬取首都之窗百姓信件网址id python 2020.2.13

假期学习【九】首都之窗百姓信件爬取代码优化以及处理 2020.2.7 Python

2020.2.13

Python 爬取北京市政府首都之窗信件列表-[后续补充]

Python 爬取北京市政府首都之窗信件列表-[信息展示]

Python 爬取北京市政府首都之窗信件列表-[数据处理]

Python 爬取北京市政府首都之窗信件列表-[Scrapy框架](2020年寒假小目标04)

假期学习【十】首都之窗百姓信件JavaWweb+Echarts图表展示

毕业设计（2020.2.13）

采集北京市政百姓信件内容——首都之窗（采用htmlunit,webmagic）附源代码、htmlUnit webmagic JAR包

python爬取北京政府信件信息02

学习日记——SDIO—SDMMC1（2020.2.13)

深度学习之线性回归——2020.2.13

【纪中2020.2.13日】模拟赛题解

#学习笔记.net 基础强化2020.2.13

2020.2.13 JZOJ1327 Mobile Service题解

Python爬虫:静态网址的爬取

假期学习【七】首都之窗信件爬取（单一页面）

通过python 爬取网址url 自动提交百度

博客开博-2020.2.13，疫情肆虐之时

纪中B组模拟赛总结（2020.2.13）

2020.2.13 大一寒假训练八（优先队列）

采集北京市政百姓信件内容

Python爬取百度图片

Python 爬取百度音乐

Python爬取糗事百科

python——百度文库爬取

Python 爬取百度图片

【Python】爬取百度图片

Python 百度图片爬取

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)