Scrapy框架爬虫学习--2 - 代码天地

Scrapy框架爬虫学习--2

其他 2018-06-14 00:07:22 阅读次数: 2

在之前的学习中已经试过了demo，今天看一下Scrapy的工程是怎样的。本节第一次正经八百的用Pycharm，暴露出了很多问题。

1. 建立工程

在想要建立工程的目录下打开终端，输入scrapy startproject zufang。

可以看一下工程的架构，

2. 打开工程

直接用Pycharm打开工程即可。

这里可能会涉及Pycharm的几个问题：interpreter配置，以及包的配置（参考他人博客中的解决方法），关于Scrapy包的安装比较麻烦，要先安装Twisted.whl文件，再安装scrapy。

这些都在pycharm 的terminal中运行就好了。需要什么就都在pycharm里面的Terminal安装就好了。

3. 新建爬虫.py脚本

在spiders文件夹下建立ganji.py 然后编写代码

inti.py --> 保持默认即可，这是初始化的文件。

items.py --> 自定义项目类的地方，也就是说爬虫获取到数据之后，传入到管道文件pipelines.py的载体

pipelines.py -->项目管道文件，对传入的项目类中的数据进行一个清理和入库

setting.py --> 设置。例如下载延迟、项目管文件中类的启动顺序以及自定义中间件的启动顺序

spiders目录 --> 里面只有一个inti.py文件，在该目录下定义爬虫类并继承 scrapy.Spider

middlewares.py --> 中间件配置

爬虫部分的代码就算简单写完了，这时候用Pycharm中的Terminal来运行这个爬虫

scrapy list可以看到这个工程下面所有的爬虫。可以看到，我们这里只有一个。

之后运行这个爬虫即可。

猜你喜欢

转载自blog.csdn.net/mike_shine/article/details/80679413

Scrapy框架爬虫学习--2

网络爬虫Scrapy框架学习2

爬虫框架Scrapy学习笔记-2

scrapy爬虫框架学习

学习随笔 Scrapy爬虫框架

Scrapy框架爬虫学习--1

python爬虫框架——Scrapy学习

爬虫框架Scrapy学习（一）

Python Scrapy爬虫框架学习

python爬虫框架Scrapy学习

爬虫Scrapy框架学习（一）

爬虫scrapy框架学习（三）

爬虫scrapy框架学习（二）

Scrapy爬虫框架学习一

学习笔记 scrapy 爬虫框架

Python学习---爬虫学习[scrapy框架初识]

【python学习】scrapy爬虫框架学习

Python爬虫--使用scrapy框架(2)

14、Python Scrapy Web爬虫框架【2】

python爬虫框架——scrapy(2) 实战练习

爬虫学习之scrapy框架入门

Python爬虫框架Scrapy学习笔记原创

网络爬虫Scrapy框架学习1

Python学习笔记——爬虫之Scrapy框架

Python爬虫框架Scrapy学习笔记

大数据-爬虫框架学习--scrapy

学习Python爬虫必备框架：Scrapy

Scrapy爬虫框架学习之Response对象

Scrapy爬虫框架学习之XPath

Python爬虫框架scrapy简单学习

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)