jdango+scrapy结合使用并爬取数据入库 - 代码天地

jdango+scrapy结合使用并爬取数据入库

其他 2019-06-20 16:53:08 阅读次数: 0

1. 创建django项目，并编写models.py,启动django项目

2. 配置Django嵌入
　　Django项目根目录下创建Scrapy项目（这是scrapy-djangoitem所需要的配置）
　　配置Django嵌入，在Scrapy的settings.py中加入以下代码：

import os
import sys
sys.path.append(os.path.dirname(os.path.abspath('.')))
os.environ['DJANGO_SETTINGS_MODULE'] = '子app.settings'
# 手动初始化Django：
import django
django.setup()

3.编写爬虫

4.item.py中引入Django模型类

import scrapy
    
from scrapy_djangoitem import DjangoItem
from 子app import models
class TalksItem(DjangoItem):
    django_model = models.表名

5.pipelines.py中调用save()

class TalksPipeline(object):
    def process_item(self, item, spider):
        print('打开数据库')
        item.save() # 数据将会自动添加到指定的表
        print('关闭数据库')
        return item

6.启动爬虫：scrapy crawl 爬虫名

7.刷新admin后台，此时数据已经入库了！

开不开心！

猜你喜欢

转载自www.cnblogs.com/kitshenqing/p/11059636.html

jdango+scrapy结合使用并爬取数据入库

42.scrapy爬取数据入库mongodb

Scrapy爬取内容的入库操作（mongodb数据库)

使用Scrapy爬取图片入库,并保存在本地

Scrapy笔记：Scrapy爬取数据在Pipeline数据入库时，偶尔出现数据重复插入的情况

使用scrapy爬取

Scrapy基于selenium结合爬取淘宝

Scrapy结合Redis实现增量爬取

scrapy爬取动态数据

Scrapy全站数据爬取

scrapy图片数据爬取

使用scrapy爬取网站

使用scrapy+mongodb爬取数据示例（附下载）

scrapy使用PhantomJS和selenium爬取数据

使用scrapy爬取京东的手机数据

创建简单的scrapy项目,并使用它来爬取数据

python 使用 scrapy 爬取数据遇到问题整理

Python爬虫实战使用scrapy与selenium来爬取数据

怎样使用Scrapy爬取NVD网站上的数据

使用Crawler对腾讯新闻进行数据爬取并保存入库

python scrapy爬取皇冠体育源码下载网站数据二（scrapy使用详细介绍）

python scrapy爬取网站数据二（scrapy使用详细介绍）

Scrapy框架的学习(2.scrapy入门，简单爬取页面，并使用管道(pipelines)保存数据)

爬虫入门（四）——Scrapy框架入门：使用Scrapy框架爬取全书网小说数据

Scrapy框架入门：使用Scrapy框架爬取全书网小说数据

Scrapy爬取伯乐在线采用两种入库方法

python scrapy爬取网站数据一

scrapy爬取数据存入mysql中

scrapy爬取数据存入表格中

scrapy爬取数据存入mongodb中

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)