全国雨水情信息爬虫 - 代码天地

全国雨水情信息爬虫

其他 2018-10-31 15:14:55 阅读次数: 0

import  requests
from lxml import etree
from  lxml import etree
heaeder={"Accept":"*/*",
"Accept-Encoding":"gzip, deflate",
"Accept-Language":"zh-CN,zh;q=0.8",
"Connection":"keep-alive",
"Content-Length":"263",
"Content-Type":"text/plain",
"Cookie":"zhuzhan=79852665; wdcid=0134cd31ee26342c; JSESSIONID=92174DBCD61964D5D44894827B16AA55.tomcat1; wdlast=1540946108",
"Host":"xxfb.hydroinfo.gov.cn",
"Origin":"http://xxfb.hydroinfo.gov.cn",
"Referer":"http://xxfb.hydroinfo.gov.cn/ssIndex.html",
    "User-Agent":"Mozilla/5.0 (Windows NT 5.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.112 Safari/537.36"}
data={"callCount":"1",
"page=":"/ssIndex.html",
"httpSessionId":"92174DBCD61964D5D44894827B16AA55.tomcat1",
"scriptSessionId":"CB88A92E5324CD72009FD446BDFBB4DB876",
"c0-scriptName":"IndexDwr",
"c0-methodName":"getSreachData",
"c0-id":"0",
"c0-param0":"string:hd",
"c0-param1":"string:",
"c0-param2":"string:",
"batchId":"0"}
url="http://xxfb.hydroinfo.gov.cn/dwr/call/plaincall/IndexDwr.getSreachData.dwr"
response=requests.post(url,headers =heaeder,data=data)
response.raise_for_status()


data1 =response.text
print(type(data1))
data2=data1.encode('utf-8').decode('unicode_escape')
html=etree.HTML(data2)
tr=html.xpath("//tr")
print(data2)
heliudata=[]
for td in tr:
    liuyu=td.xpath("./td[1]/text()")
    xingzhenqu=td.xpath("./td[2]/text()")
    heming=td.xpath("./td[3]/text()")
    zhanming=td.xpath("./td[4]//text()")
    riqi=td.xpath("./td[5]/text()")
    shuiwei=td.xpath("./td[6]//text()")
    liuliang=td.xpath("./td[7]/text()")
    jingjieshuiwei=td.xpath("./td[8]/text()")
    print(str(liuyu)+","+str(xingzhenqu)+","+str(heming)+","+str(zhanming)+","+str(riqi)+","+str(shuiwei)+","+str(liuliang)+","+str(jingjieshuiwei))
    heliudata.append(str(liuyu)+","+str(xingzhenqu)+","+str(heming)+","+str(riqi)+","+str(shuiwei)+","+str(liuliang)+","+str(jingjieshuiwei))



print("#"*30)
print(heliudata)

猜你喜欢

转载自www.cnblogs.com/guoshanyun/p/9883160.html

全国雨水情信息爬虫

基金详情信息获取之 Java 爬虫

网络爬虫之疫情信息爬取（2020-02-02 16:51:20）

python3爬虫全国地址信息

python爬虫-全国列车信息查询

结对-疫情信息采集

当我用Python采集全国加盟品牌详情信息，并进行可视化分析后发现了这些

全国大江大河水情数据汇总2018

全国大型水库水情数据汇总2018

python抓取币圈行情信息

java获取图片详情信息

疫情信息可视化

使用Android显示疫情信息

全球疫情信息可视化

Android—获取apk详情信息

Python番外篇：疫情信息弹窗

JavaWeb疫情信息管理系统

使用Jsoup爬虫获取统计局全国地区信息

中小河流雨水情监测_水文监测预警系统

小型水库雨水情测报设施建设-水库大坝水文监测

小型水库雨水情测报设施建设24小时守护水库大坝安全！

JVM打印加载类的详情信息

币车日报：行情信息&规则变化 | 0702

八爪鱼采集列表和详情信息

sql 语句查看表结构的详情信息

微信小程序分类及详情信息模块的分析

武汉肺炎冠状病毒疫情信息接口Api

JavaScript动态显示详情信息框(绝对定位)

收集疫情信息，协同办公软件免费的有那些

Python操作Excel（三）- 疫情信息统计项目

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)