Scrapy爬虫之MongoDB数据存储 - 代码天地

Scrapy爬虫之MongoDB数据存储

其他 2018-06-30 14:04:35 阅读次数: 0

小编是一个爬虫初学者，学习python爬虫已有一段时间了，对Scrapy框架开发有自己的一点小见解，如果有说不对的地方，希望大家多多指点。小编用的是Python2.7，如果觉得版本太旧，也可以用3.x版本，可能语法上有点不同。为了方便，小编在windows系统下开发案例。小编这次做了关于对拉勾网招聘信息采集的简单爬虫，并将采集的信息存放到MongoDB数据库中。

在开始代码之前，还没有安装过MongoDB的朋友，可以先去官网下载并安装。MongoDB下载官网：https://www.mongodb.com/download-center；安装和使用教程：

http://www.runoob.com/mongodb/mongodb-window-install.html.安装和配置完成后，因为权限不足的问题，需要在管理员模式下启动MongoDB，MongoDB的开启方法已在使用教程中展示，如下图所示.

　　

　然后打开任意浏览器，输入地址：http://localhost:27017，如果一切正常，如下图所示，表示MongoDB数据正常使用.

　　　　

　　

　启动MongoDB后，创建爬虫工程，以lagou为例，具体代码如下：

　编写lagourecruit.py文件

　　　　

　　　　

　　

　编写items.py文件

　　　　

　　

　编写setting.py文件，同时设置好自己的User-Agent

　　　　

　　

　编写pipelines.py文件

　　　　

　　

　编写start.py文件

　　　　

　　

　执行start.py脚本（ps:在这里小编只展示一部分）

　　　　

　　

　在MongoDB启动的状态下，数据已成功写入到数据库中，小编向大家展示两种数据库的查阅方式。

　方式一：另外打开一个以管理员身份运行的cmd窗口，进入到MongoDB安装盘的mongodb\bin文件目录下，输入mongo命令，小编这里以F盘为例，如下图所示.

　　　　

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　

　　

　完成之后，输入use+工程名（如use lagou），接着输入查看数据库命令：show collections，再输入db.数据库名称.find()（如db.lagourecruit.find()）查看数据库内容，如下图所示.

　　　　

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　

　　

　方式二：利用MongoDB可视化工具RoboMongo，RoboMongo下载地址：

http://www.softpedia.com/get/Internet/Servers/Database-Utils/Robomongo.shtml#download，安装完成并打开，建立主机连接，如下图所示.

　　　　

　　　　　　　　　　　　　　　　

　　

连接成功后，即可查阅数据库内容，如下图所示.

　　　　

　　　　

　　　　

END

　　

　　

猜你喜欢

转载自www.cnblogs.com/zjkf8686/p/9246761.html

Scrapy爬虫之MongoDB数据存储

scrapy mongodb 数据存储

Python爬虫框架Scrapy实例（三）数据存储到MongoDB

python盗墓笔记爬虫爬虫scrapy——MongoDB存储

python盗墓笔记爬虫爬虫scrapy_redis——MongoDB存储

爬虫之MongoDB存储（下）

爬虫之MongoDB存储（中）

爬虫之MongoDB存储上

爬虫之存储库MongoDB

爬虫框架scrapy之MongoDB的安装

scrapy爬虫案例：用MongoDB保存数据

scrapy爬虫案例数据存入MongoDB

Scrapy实战之存储在MongoDB中

scrapy 爬虫框架之持久化存储

爬虫-scrapy数据的持久化存储

用Scrapy爬虫爬取豆瓣电影排行榜数据，存储到Mongodb数据库

Scrapy爬取数据存储到Mongodb数据库

Python3爬虫（十）数据存储之非关系型数据库MongoDB

scrapy爬虫之item pipeline保存数据

Scrapy学习篇（四）之数据存储

Python爬虫之数据存储

腾讯招聘爬虫（Scrapy + Mongodb）

Scrapy爬虫框架管道文件pipelines数据图像存储

爬虫：Mongodb存储库

python数据分析之爬虫六：Scrapy爬虫

数据存储之使用MongoDB数据库存储数据

爬虫之scrapy网络爬虫

爬虫框架之Scrapy

爬虫之 scrapy框架

python爬虫之scrapy

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)