pycharm实现scrapy爬虫的生成和入门 - 代码天地

pycharm实现scrapy爬虫的生成和入门

其他 2020-08-04 01:56:52 阅读次数: 0

虽然是用pycharm进行调试，但是最开始一定不要在pycharm中生成项目，因为要用scrapy自己生成一个项目，否则会缺少如同scrapy.cfg的配置文件，导致Unknown command: crawl错误。
所以先在自己想要的地方开始：

scrapy startproject myproject

注意这个myproject是自定义的文件夹。然后在pycharm里找到这个项目。发现已经自动生成了这样的结构，也帮忙配置好了环境变量。
在这里插入图片描述
创建项目之后，我们还需要创建一个爬虫，官方的语法如下：

scrapy genspider [-t template] <name> <domain>

注意：name参数是爬虫名，不能与项目名相同，domain参数是想要爬取的网站。然后就能在spiders里面看到刚刚的生成的爬虫。
在这里插入图片描述
runspider命令可以直接通过运行 .py 文件来启动爬虫。此时要退到根目录下输入，注意不需要输入.py：

scrapy crawl <spider_file>

在这里插入图片描述
如果不想在命令行执行就可以在根目录下设置启动的脚本，我设置的名字叫做start.py,其中myspider可以替换成任意爬虫名字。

接下来是命令行的调试：

scrapy shell [url]

注意官方文档：https://scrapy-chs.readthedocs.io/zh_CN/0.24/topics/commands.html

猜你喜欢

转载自blog.csdn.net/qq_41337100/article/details/106456551

pycharm实现scrapy爬虫的生成和入门

在pycharm中使用scrapy爬虫

scrapy爬虫快速入门

爬虫(七)scrapy入门

Scrapy爬虫入门

爬虫进阶：Scrapy入门

爬虫——scrapy入门

Scrapy Python爬虫入门

Scrapy 爬虫入门

Scrapy爬虫入门基础

python爬虫scrapy入门

Scrapy爬虫快速入门

python 爬虫框架scrapy学习记录和整理 python爬虫框架scrapy入门文档学习

Scrapy爬虫入门教程一安装和基本使用

Scrapy爬虫入门Request和Response（请求和响应）

pycharm 运行调试scrapy爬虫项目

Pycharm中运行Scrapy爬虫程序

Scrapy爬虫框架入门

爬虫框架scrapy入门（一）

python爬虫入门（3）----- scrapy

Python爬虫框架scrapy的入门

Python爬虫之路-Scrapy入门

爬虫入门六（异步的爬虫框架scrapy）

python爬虫入门 ✦ 乞丐版scrapy_redis分布式 + 增量式爬虫的实现

Python爬虫实现 — Scrapy使用

Golang 的类Scrapy爬虫实现

通过scrapy实现简单爬虫

Scrapy爬虫的暂停和启动

【Python爬虫：Scrapy】之 PyCharm 搭建Scrapy环境+创建Scrapy项目实例

[爬虫入门]Python中使用scrapy框架实现图片爬取

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)