Python使用Scrapy框架爬虫（一） - 代码天地

Python使用Scrapy框架爬虫（一）

其他 2018-06-18 20:57:56 阅读次数: 2

软件环境：Pycharm 2018 python:3.6

1.首先我们需要安装scrapy模块，pip install scrapy ，不过这种方式经常会遇到许多未知的bug

建议参考这篇博客：https://blog.csdn.net/liuweiyuxiang/article/details/68929999

2.新建scrapy项目，cmd 进入工作区间目录，比如我们新建项目名称为scrapydemo的项目：

scrapy startproject scrapydemo

3.使用Pycharm打开新建的scrapy项目，项目目录如下:

pipelines.py主要对爬取得结果进行处理，比如我们可以再次将爬取结果插入数据库

items.py在这里我们可以理解为java中的实体类，定义我们要抓取的字段等信息

setting.py中主要是一些配置信息，ITEM_PIPELINES = {
'scrapydemo.pipelines.ScrapydemoPipeline': 300,

}我们需要将这个修改成自己的pipelline

4.在spiders中新建一个scrapy的py文件，可以手动新建但需要自己写代码，我们使用命令：

scrapy genspider --t basic baidu baidu.com

在parse函数中进行爬虫部分的代码，将爬取结果赋值给item中对应别的字段，使用yield 返回item

5.在cmd命令行使用scrapy crawl 名字（不是项目名字是 name）

猜你喜欢

转载自blog.csdn.net/huangliniqng/article/details/80150419

Python使用Scrapy框架爬虫（一）

python 爬虫 scrapy框架的使用一

Python爬虫框架Scrapy入门（一）Scrapy安装及基本使用

Python爬虫框架Scrapy的使用

Python 爬虫（一）scrapy框架

python 爬虫 scrapy框架（一）

python爬虫 scrapy爬虫框架的基本使用

python使用Scrapy框架进行爬虫编程

Python Scrapy爬虫框架之初次使用

Python爬虫--使用scrapy框架(1)

Python爬虫--使用scrapy框架(2)

python爬虫练习(使用scrapy框架)

python爬虫框架--scrapy 基本使用

python 爬虫 scrapy框架的详细使用

python爬虫笔记（七）:使用Scrapy框架

Python爬虫 --- 2.3 Scrapy 框架的简单使用

Python爬虫之Scrapy框架使用selenium

python爬虫框架：scrapy 的安装与使用

Python爬虫之Scrapy框架的基本使用

Python 后端爬虫Scrapy 框架使用

Python:爬虫框架Scrapy的安装与基本使用

python爬虫之scrapy框架的使用-基础

Python的爬虫框架Scrapy基本使用

Python爬虫基础（五）：使用scrapy框架

Python爬虫框架Scrapy实例（一）

Python Scrapy 爬虫框架实例（一）

python爬虫攻略（一）：Scrapy框架

Python的网络爬虫框架-Scrapy爬虫框架的使用

scrapy 框架 python 爬虫

python爬虫-scrapy框架

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)