python scrapy框架爬取豆瓣top250电影篇一存储数据到mongogdb | mysql中 - 代码天地

python scrapy框架爬取豆瓣top250电影篇一存储数据到mongogdb | mysql中

其他 2018-12-11 10:01:32 阅读次数: 0

版权声明：zhiyu https://blog.csdn.net/ichglauben/article/details/82559310

存到mongodb中

环境

windows7
mongodb4.0

mongodb安装教程
设置具体参数
这里写图片描述
在管道里面写具体参数

这里写图片描述
打开settings 设置参数
mongo3
测试开始–结果

代码

import  pymongo
from douban.settings import  mongo_host,mongo_port,mongo_db_name,mongo_db_collection


class DoubanPipeline(object):
    def __init__(self):
        host = mongo_host
        port = mongo_port
        dbname = mongo_db_name
        sheetname = mongo_db_collection
        client = pymongo.MongoClient(host=host,port=port)
        mydb = client[dbname]
        self.post = mydb[sheetname]
     def process_item(self, item, spider):
        data = dict(item)
        self.post.insert(data)
        return item

存到mysql中

大致步骤类似不过先要建表
mysql

create database douban DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;
use douban;
CREATE TABLE doubanmovie (
    serialnumber int(5), moviename VARCHAR(100) NOT NULL,
    introduce VARCHAR(150),  
    rating VARCHAR(10),
    evaluate VARCHAR(10),  
    describe_movie VARCHAR(100)
) ;

setttings设置

MYSQL_HOST = '192.168.1.117'
MYSQL_DBNAME = 'douban'
MYSQL_USER = 'root'
MYSQL_PASSWD = 'root'

这里写图片描述
在管道里面写参数


def __init__(self):
self.connect = pymysql.connect(
host=MYSQL_HOST,
db=MYSQL_DBNAME,
user=MYSQL_USER,
passwd=MYSQL_PASSWD,
charset='utf8',
use_unicode=True)
# 通过cursor执行增删查改
self.cursor = self.connect.cursor();

def process_item(self, item, spider):
#data = dict(item)
#self.post.insert(data)
#####mysql
try:
# 插入数据
self.cursor.execute(
"""insert into doubanmovie(serialnumber, moviename,introduce, rating, evaluate , describe_movie)#row name
value (%s, %s, %s, %s, %s, %s)""",
(item['serial_number'],
item['movie_name'],
item['introduce'],
item['star'],
item['evaluate'],
item['describe']))

# 提交sql语句
self.connect.commit()

except Exception as error:
# 出现错误时打印错误日志
log(error)

return item

这里写图片描述

猜你喜欢

转载自blog.csdn.net/ichglauben/article/details/82559310

python scrapy框架爬取豆瓣top250电影篇一存储数据到mongogdb | mysql中

python利用pyquery库实现爬取豆瓣电影排行top250并存储到mysql数据库中

python scrapy框架爬取豆瓣top250电影篇一scrapy原理介绍

【python】爬取豆瓣电影排行榜Top250存储到Excel文件中【附源码】

【python】爬取豆瓣电影排行榜TOP250存储到CSV文件中【附源码】

Python爬取豆瓣电影Top250（数据保存到Excel中）

python scrapy框架爬取豆瓣top250电影篇一Windows下建立Scrapy项目，pycharm编辑

python scrapy框架爬取豆瓣top250电影篇一明确目标&&爬虫编写

python scrapy框架爬取豆瓣top250电影篇一代理编写

Python3 Scrapy框架学习五：使用crawl模板爬取豆瓣Top250，并存入MySql、MongoDB

Python爬虫学习-豆瓣电影TOP250数据爬取（存入mongo数据库中）

python爬虫——爬取豆瓣电影top250信息并加载到MongoDB数据库中

Python爬虫 - scrapy - 爬取豆瓣电影TOP250

Python爬取豆瓣Top250电影中2000年后上映的影片信息

python中lxml+cssselect爬取豆瓣电影Top250

Python3 Scrapy框架学习二：爬取豆瓣电影Top250

python 利用scrapy爬取豆瓣TOP250部电影信息分别保存为csv、json、存入mysql、下载海报图片

小项目（爬虫） Python爬虫爬取豆瓣TOP250电影数据并存入Mysql数据库（附Python代码）

scrapy爬取豆瓣top250并插入到MySQL数据库（入门级）

python scrapy爬虫练习(1) 爬取豆瓣电影top250信息

爬取豆瓣电影top250（python3）

python爬取豆瓣电影Top250

（十七）Python爬虫：爬取豆瓣电影TOP250

python爬虫--爬取豆瓣top250电影名

python爬取豆瓣电影Top250的信息

用Python爬取豆瓣Top250的电影标题

python 爬虫&爬取豆瓣电影top250

python 豆瓣top250电影的爬取

python爬虫入门 ✦ 爬取豆瓣电影Top250

python爬虫之爬取豆瓣电影top250

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)