biubiu~你有一份中国人口数据需要查收 - 代码天地

biubiu~你有一份中国人口数据需要查收

其他 2020-04-04 15:44:18 阅读次数: 0

爬取世界人口网上的中国各省的2019年人数和2018年GDP

（数据并非完全真实有效）

import requests
import time
from selenium import webdriver
from bs4 import BeautifulSoup
import pandas as pd
from selenium.webdriver.common.action_chains import ActionChains

def get_page(url):
    driver = webdriver.Chrome()
    driver.get(url)
    xpath = '//*[@id="menu-item-9802"]/a'
    ActionChains(driver).click(driver.find_element_by_xpath(xpath)).perform()
    time.sleep(1)
    xpath1 = '//*[@id="copy"]/div[1]'
    table1 = driver.find_element_by_xpath(xpath1).get_attribute('innerHTML')
    soup = BeautifulSoup(table1,'html.parser')
    tb = soup.find_all('tr')
    return tb

def find_message(tb):
    for row in tb:
        cols = [col.text for col in row.find_all('td')]
        if cols[0] == '排名':
            continue
        index.append(cols[0])
        adress.append(cols[1])
        number_2019.append(cols[2])
        GDP_18.append(cols[3])

def save_message():
    data = {'排名':index,'地区':adress,'2019年人口':number_2019,'2018年GDP':GDP_18}
    dataframe = pd.DataFrame(data)
    dataframe.to_csv('Pnumber.csv',index=False,sep=',',encoding='utf-8-sig')

def main():
    tb = get_page(url)
    find_message(tb)
    save_message()

url = 'http://www.chamiji.com'
index = []
adress = []
number_2019 = []
GDP_18 = []
main()

发布了32 篇原创文章 · 获赞 14 · 访问量 1200

私信关注

猜你喜欢

转载自blog.csdn.net/qq_45770364/article/details/105101684

biubiu~你有一份中国人口数据需要查收

系统不做限流，我看你是对中国人口数量有什么误解

python/folium绘制中国人口数量热力图(HeatMap)

嘀，你有一份1024礼物待查收！

数据告诉你：中国人的收入差距有多大？

中国人民大学与加拿大女王大学金融硕士——每一份投入和努力其实都有回声

中国人口发展趋势

[译] 如何计划你的一天 —— 这里有一份攻略请查收

你有一份2019运维技能风向标，请查收

同学，你有一份来自支付宝AI学姐的面试锦囊待查收

你有一份新的C++书单，请注意查收！

你有一份经典SQL语句大全，请注意查收！！！

基于美国人口数据分析

使用Pandas处理美国人口数据

python爬虫数据（中国人口信息）存入MYSQL数据库

叮！你有一份2018英特尔人工智能大会的邀请函，请查收！

Hi，你有一份 TiDB 易用性挑战赛「捞分指南」请查收

直播预告丨叮咚～这里有一份冠军分享的比赛经验等你查收

叮咚~ 你有一份令人心动的offer待查收【cv君独家内推】

“一胎化”35年，Python可视化初探中国人口变化

加你在内！@13亿中国人想要学习的大数据学习路线！了解一下

叮！您有一份第22届中国国际工业博览会的邀请函待查收

中国人最需要的“基础文明”有三项

送给你的一份英语学习资料，请查收！

【C语言-16】滴滴滴~~一份"等大数组内容互换"请你查收~~~

送你一份SpringBoot注解大全，请查收！--文末送书

给你一份详细的CSS布局指南，请查收

这有一份雪浪大会超全攻略，请查收

这有一份廖雪峰大牛的Java高级架构师教程，请查收！

这里有一份最新的课程分享清单，收集好久了，请查收

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

周排行

购置笔记本常识

从源码看Spring Security之采坑笔记（Spring Boot篇）

大数据学习——高可用配置案例

如何避免选择不专业的建站公司?

Euclid's Game HDU - 1525（博弈）

面试笔记（六）---Js实现eventHandler

Windows 实例搭建的 FTP 在外网无法连接和访问

设计模式 : 桥接模式

USB 设备驱动开发之几个重要结构体分析

14-p14_sqrt求平方根

每日归档

更多

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)