[python 那些事] [初级练习] 简单爬虫武汉加油 - 代码天地

[python 那些事] [初级练习] 简单爬虫武汉加油

编程语言 2020-03-03 22:01:16 阅读次数: 0

目标网站：https://news.163.com/special/epidemic/
任务：爬取当日各地疫情基本状况
适合人群：了解基本python代码，小项目实训

代码如下

先引入爬虫利器requests 和数据处理小能手pandas

import requests
import pandas as pd

下面函数是获取json数据

def get_page(url):
    headers={'User-Agent':'XXXXXXX'}
    r=requests.get(url, headers=headers)
    r.encoding = r.apparent_encoding
    a=r.json()
    return a

下面就需要稍微分析一下网页源码了，毕竟是提取有效信息嘛

def parse_page(html):
    all=[]
    china = html['data']['areaTree'][0]['children']
    for i in range(len(china)):
        provinceName=china[i]['name']
        for j in range(len(china[i]['children'])):
            cityName = china[i]['children'][j]['name']
            confirm = china[i]['children'][j]['today']['confirm']
            dead = china[i]['children'][j]['today']['dead']
            heal = china[i]['children'][j]['today']['heal']
            suspect = china[i]['children'][j]['today']['suspect']
            lastUpdateTime = china[i]['children'][j]['lastUpdateTime']
            a = {'province':provinceName,'city':cityName,
                     'confirm':confirm,'dead':dead,'heal':heal,
                    'suspect':suspect,'lastUpdateTime':lastUpdateTime}
            all.append(a)
    return all

下面是将有效数据保存到文件中

def save_file(all):
    df = pd.DataFrame(all)
    order=['province','city','confirm','dead','heal','suspect','lastUpdateTime']
    df = df[order]
    df.to_csv('pachong.csv',index=True,header=True)

上面都是函数下面就是执行啦

url = "https://c.m.163.com/ug/api/wuhan/app/data/list-total?t=316639086783"
dataJson = get_page(url)
allData = parse_page(dataJson)
save_file(allData)

老规矩有问题私聊

☞跟着感觉走☜

发布了17 篇原创文章 · 获赞 51 · 访问量 4483

私信关注

猜你喜欢

转载自blog.csdn.net/qq_44172732/article/details/104642592

[python 那些事] [初级练习] 简单爬虫武汉加油

武汉加油！（Python版）

我用Python爬虫挣钱的那些事

用爬虫，看疫情。武汉加油，中国加油！！

用Python实现国旗的绘制，中国加油，武汉加油。

用Python为武汉加油！为中国加油！

第5上机练习~~~~~~~~~~~~~~~~~~~~~~~~~~~~武汉一定要加油！！！

第N上机练习~~~~~~~~~~~~~~~~~~~~~~~~~~~~武汉一定要加油！！！

probuf与python那些事

关于Python那些事

python 内存那些事

python那些事总结

加油武汉！

武汉加油！

武汉加油！

武汉加油！

武汉加油

Python初级知识练习

Python练习（初级解法）

Python那些事——一个Python小白5个小时爬虫经历

武汉加油！中国加油！

“武汉加油”“中国加油”

中国加油！武汉加油！

Python环境搭载那些事

python那些事.No1

python那些事.No3

python那些事.No2

聊一聊，这些年我用Python爬虫挣钱的那些事

python初级练习题

【Python那些事】 python中类的使用

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)