python爬虫(九、爬取豆瓣top250电影信息并插入数据库sqlite) - 代码天地

python爬虫(九、爬取豆瓣top250电影信息并插入数据库sqlite)

其他 2020-06-22 11:13:34 阅读次数: 0

项目简介

从豆瓣top250爬取下所有250部电影信息并保存到excel或者数据库

$\color{Red}因为上一节已经讲了如何插入到excel,现在说插入数据库$

$\color{Red}Ⅰ.建立数据库$

def init_db(dppath):    #初始化数据库
    sql='''
        create table movie250
        (
        id integer primary key autoincrement,
        title text,
        intorduce text,
        img_link text
        )
    '''	#sql语句,创建表,有三列分别是title,intorduce,img_link
    conn = sqlite3.connect(dppath)  #链接到数据库
    cursor = conn.cursor()  #获取游标(对象,类似excel的sheet)
    cursor.execute(sql)	#执行
    conn.commit()	#提交
    conn.close()

$\color{orange}Ⅱ.插入数据到数据库$

def save_to_sqlite(dbpath,url): #保存到数据库
    #init_db(dbpath)    #我以前创建过这个数据库,所以注释掉
    conn = sqlite3.connect(dbpath)	#连接到数据库
    cur = conn.cursor()	#获取游标
    datalist = getdata(url)	#得到爬取的电影数据
    for data in datalist:	#循环每一部电影
        for index in range( len(data) ):	#循环每部电影的三个内容
            data[index] = '"'+data[index]+'"'	#插入数据库加上" "
        sql = '''
            insert into movie250
            (title,intorduce,img_link)
            values(%s)
        '''%",".join(data)   #%把后面的填充到前面的%s,join方法用逗号分隔
        cur.execute(sql)	#每部电影都执行这个sql语句插入
        conn.commit()
    cur.close()
    conn.close()

猜你喜欢

转载自blog.csdn.net/jziwjxjd/article/details/106883328

python爬虫(九、爬取豆瓣top250电影信息并插入数据库sqlite)

python爬虫——爬取豆瓣电影top250信息并加载到MongoDB数据库中

python爬虫——爬取豆瓣top250电影信息

爬虫学习之11：爬取豆瓣电影TOP250并存入数据库

Python爬虫学习-豆瓣电影TOP250数据爬取（存入mongo数据库中）

爬虫实战：爬取豆瓣TOP250电影信息

【爬虫】爬取豆瓣Top250电影信息

python爬取豆瓣电影top250数据存入数据库

（十七）Python爬虫：爬取豆瓣电影TOP250

python爬虫--爬取豆瓣top250电影名

python 爬虫&爬取豆瓣电影top250

Python爬虫 - scrapy - 爬取豆瓣电影TOP250

python爬虫入门 ✦ 爬取豆瓣电影Top250

python爬虫之爬取豆瓣电影top250

python爬虫爬取豆瓣电影TOP250

爬虫练习-爬取豆瓣电影TOP250的数据

python爬取豆瓣电影Top250的信息

python项目-爬取豆瓣top250电影信息

零基础爬虫----python爬取豆瓣电影top250的信息

零基础爬虫----python爬取豆瓣电影top250的信息（转）

python爬虫Day2：爬取豆瓣电影信息top250

python scrapy爬虫练习(1) 爬取豆瓣电影top250信息

小项目（爬虫） Python爬虫爬取豆瓣TOP250电影数据并存入Mysql数据库（附Python代码）

豆瓣Top250电影信息python爬虫excel/sqlite数据存储教程

Python网页爬虫爬取豆瓣Top250电影数据——Xpath数据解析

Python网络爬虫数据采集实战：豆瓣电影top250爬取

python爬虫——爬取豆瓣top250电影数据（适合初学者）

案例学python——案例三：豆瓣电影信息入库一起学爬虫——通过爬取豆瓣电影top250学习requests库的使用

scrapy爬取豆瓣top250并插入到MySQL数据库（入门级）

爬取豆瓣TOP250个电影信息

今日推荐

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

虽然老乡鸡开源的不是代码，但背后的原因却让人很暖心

富文本编辑器 Quill 2.0 重磅发布，特性、可靠性与开发者体验大幅提升

周排行

使用Redis中间件解决商品秒杀活动中出现的超卖问题（使用Java多线程模拟高并发环境）

野指针及c++指针使用注意点

redis 3.0　新特性

(翻译)火狐操作系统javascript API

微信小程序开发入门

mysql数据查询之五子句(where、group by、having、order by和limit)

Codeforces Round #517 Div. 1翻车记

在caffe 中实现Generative Adversarial Nets（二）

企业级漏洞扫描工具

java byte数组与String互转

每日归档

更多

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)

2024-04-15(42)

2024-04-14(0)