Scrapy之一——创建简单项目 - 代码天地

Scrapy之一——创建简单项目

其他 2018-08-17 17:04:07 阅读次数: 0

相比自己写爬虫，使用Scrapy框架可以帮我们简化项目逻辑设计，我们不必费力去考虑定义什么类实现什么功能，只需要在项目已有的文件中添加相应的内容。也免去代码性能设计的麻烦，使用Scrapy可以轻松获得高性能高并发的爬取进程，不必进行专门的并发设计。

在安装完Scrapy框架后，开始一个简单项目以测试。

1.创建项目

在Windows操作系统下，打开DOS,进入到项目目录中。

输入命令：

scrapy startproject hello   'hello可以替换成自定义的项目名称'

项目就创建完成了

2.创建爬虫文件

由于我们创建的爬虫项目中并不存在实际共工作的爬虫文件，我们需要单独创建该文件。

DOS下进入项目目录

输入命令：

scrapy genspider demo www.baiduc.com   'demo是爬虫名，可以自定义' 'www.baidu.com可替换为要爬取的网址'

在项目的spiders中就会多了一个名为demo.py的文件。

3.配置爬虫文件

allowed_domains    --要爬取的网站，若设置此项，该爬虫只能爬取该网站下的网页

allowed_domains = ['www.baidu.com']

start_urls         --爬取的开始网址

start_urls = ['http://www.baidu.com/']

def parse(self, response):   ----返回函数，response是返回值

    def parse(self, response):
        print(response.url)
        pass

4.运行爬虫

通过命令行来运行

scrapy crawl demo 'demo 为爬虫名'

猜你喜欢

转载自blog.csdn.net/ScapeD/article/details/81335586

Scrapy之一——创建简单项目

Maven简单项目创建

cube.js 学习（一）简单项目创建

Vue安装并创建一个简单项目

使用Android studio创建一个简单项目

IntelliJ IDEA 创建 Maven简单项目

创建登录注册简单项目参考

SpringBoot——简单项目的创建

idea创建一个springboot多模块项目之springcloud简单项目测试

创建Scrapy项目（一）

pycharm社区版安装django并创建一个简单项目

Hibernate框架-01-02-环境搭建与创建第一个简单项目

创建JavaWeb简单项目（超级详细、一看就会）—— 1

初学springboot+Mybatis+MySQL+idea创建简单项目

webpack+vue创建简单项目并整合iview

idea创建基于maven的springMVC简单项目

scrapy（一）--Pycharm创建scrapy项目

简单创建一个scrapy项目,并创建爬百度的spider文件

Tensorflow简单项目讲解

springboot简单项目搭建

【华为软开云系列】之项目管理(1)-创建简单项目看板

开启Scrapy项目之旅之一：认识Scrapy项目的目录结构

scrapy爬虫框架学习（一）scrapy的配置和项目创建

SpringBoot入门+IntelliJ IDEA+maven创建简单项目+打jar包

使用idea 创建maven简单项目自定义骨架

scrapy的一个简单小项目

创建简单的scrapy项目,并使用它来爬取数据

使用Ant构建简单项目

vue-cli 搭建简单项目

以太坊学习（：：）简单项目实战

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)