python爬虫数据（中国人口信息）存入MYSQL数据库 - 代码天地

python爬虫数据（中国人口信息）存入MYSQL数据库

编程语言 2018-06-04 15:03:00 阅读次数: 2

爬取网站:http://www.china-10.com/news/488659.html

代码以及注释如下：

import requests
from bs4 import BeautifulSoup
import re
import MySQLdb

#连接数据库
db = MySQLdb.connect("localhost","root","123456","lianxi",charset="utf8")
cursor = db.cursor()
#数据库中如果已经有china_population此表，则删除已存在的此表
cursor.execute("DROP TABLE IF EXISTS china_population")
#创建新表china_population
sql = r"""CREATE TABLE china_population (
        rank INT(100) NOT NULL,
        province CHAR(100) NOT NULL,
        population INT(100) NOT NULL,
        rise INT(100) NOT NULL)"""
cursor.execute(sql)

url = 'http://www.china-10.com/news/488659.html'
html = requests.get(url)
soup = BeautifulSoup(html.content,'html.parser')
#找到所有class为md_td的td元素
aaa = soup.find_all(name="td", attrs={"class":re.compile(r"md_td")})
#检查索引，以便于后面爬取工作
#for n,i in enumerate(aaa):
#    print(n,i.text)
demo_list = []
for i in aaa[4:128]:
    demo_list.append(i.text)
while demo_list:
    print(int(demo_list[0:4][0]),demo_list[0:4][1],int(float(demo_list[0:4][2])*10000),int(float(demo_list[0:4][3])*10000))
#   测试数据类型
#   print(type(demo_list[0:4][0]), type(demo_list[0:4][1]), type(demo_list[0:4][2]), type(demo_list[0:4][3]))
    insert_message = ("INSERT INTO china_population(rank,province,population,rise)" "VALUES(%s,%s,%s,%s)")
    data = (int(demo_list[0:4][0]),demo_list[0:4][1],int(float(demo_list[0:4][2])*10000),int(float(demo_list[0:4][3])*10000))
#   数据插入数据库
    cursor.execute(insert_message, data)
    db.commit()
    del demo_list[0:4]
#关闭数据库
db.close()

主要步骤：

1.连接数据库并且创建表；

2.爬取并整理信息；

3.将信息存入数据库；

4.关闭数据库。

数据表展示如下：

猜你喜欢

转载自blog.csdn.net/heibuliuqiu_gk/article/details/80560382

python爬虫数据（中国人口信息）存入MYSQL数据库

改写数据库历史的中国人

Python爬虫小实践：寻找失踪人口，爬取失踪儿童信息并写成csv文件，方便存入数据库

国产多维数据库 NeuralCube！中国人自己的大数据底层核心技术！

biubiu~你有一份中国人口数据需要查收

数据库系统概论（一）——慕课网中国人大

数据库系统概论（六）——慕课网中国人大

数据库系统概论（四）——慕课网中国人大

数据库系统概论（三）——慕课网中国人大

数据库系统概论（二）——慕课网中国人大

数据库系统概论（九）——慕课网中国人大

数据库系统概论（八）——慕课网中国人大

数据库系统概论（七）——慕课网中国人大

数据库系统概论（五）——慕课网中国人大

数据库系统概论（十）——慕课网中国人大

Python爬取论文标题、作者、摘要等信息并存入MySQL--简述爬虫是如何将爬取数据存入MySQL数据库

python爬虫示例爬取网页信息，并且将爬取到的信息存入数据库。

Python数据采集与分析课程设计【1949-2022中国人口历史数据分析预测】

中国人口发展趋势

scrapy爬虫数据存入mysql数据库

将爬虫爬到的数据存入MySQL数据库

【爬虫高阶】豆瓣读书数据存入Mysql数据库

python爬虫爬取ip记录网站信息并存入数据库

python爬虫爬取网上药品信息并且存入数据库

python3 scrapy爬虫进行爬取数据存入MySQL数据库

python爬虫获取数据后存入MySQL数据库中

Python网络爬虫抓取动态网页并将数据存入数据库MYSQL

数据库系统概论（新技术篇）--中国人民大学【第13讲】

数据库系统概论（高级篇）中国人民大学单元测验1

python3.7爬虫实战系列爬取掘金网首页存入mysql数据库

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)