Scrapy框架学习 - Scrapy框架的安装与使用

一.安装

(1) 如果你已经安装Anaconda了,打开终端,输入conda install scrapy

安装后输入scrapy检测是否安装成功,出现如下页面说明成功

(2)如果没有安装Anaconda

  • 安装lxml

最好的安装方式是通过wheel文件来安装,http://www.lfd.uci.edu/~gohlke/pythonlibs/,从该网站找到lxml的相关文件。假如是Python3.5版本,WIndows 64位系统,那就找到lxml‑3.7.2‑cp35‑cp35m‑win_amd64.whl 这个文件并下载,然后通过pip安装。

下载之后,运行如下命令安装:

pip3 install wheel
pip3 install lxml‑3.7.2‑cp35‑cp35m‑win_amd64.whl

即可完成lxml的安装,其他文件替换文件名即可。

  • 安装zope.interface

到官方网站https://pypi.python.org/pypi/zope.interface#downloads下载对应版本的wheel文件,然后pip安装。比如Python 3.5版本,Windows 64位系统,就下载zope.interface-4.3.3-cp35-cp35m-win_amd64.whl。

然后安装wheel文件即可,命令如下:

pip3 install zope.interface-4.3.3-cp35-cp35m-win_amd64.whl

其他版本替换文件名即可。

  • 安装pyOpenSSL

官方网站下载wheel文件,https://pypi.python.org/pypi/pyOpenSSL#downloads,如当前最新版本名称是pyOpenSSL-16.2.0-py2.py3-none-any.whl,下载后安装即可。

pip3 install pyOpenSSL-16.2.0-py2.py3-none-any.whl
  • 安装Twisted

同理,http://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted下载wheel文件,利用pip安装即可。
如Python 3.5版本,Windows 64位系统,下载
Twisted‑17.1.0‑cp35‑cp35m‑win_amd64.whl,然后pip安装。

pip3 install Twisted‑17.1.0‑cp35‑cp35m‑win_amd64.whl
  • 安装pywin32

从官方网站 https://sourceforge.net/projects/pywin32/files/pywin32/Build%20220/ 下载对应版本的安装包安装即可。

  • 安装Scrapy

最后安装Scrapy即可,依然使用pip,命令如下:

pip3 install Scrapy

二.使用 

  • cd 路径      先定位到自己想要创建爬虫项目的位置

  • scrapy startproject 项目名

 

  • 桌面会生成一个文件夹,用pycharm打开后项目结构如图:

spider:专门存放爬虫文件

__init__.py:初始化文件

items.py:存放爬虫数据

middlewares.py:处理爬虫前的请求和响应,例如设置headers

pipelines.py:管道文件,在存储爬虫数据之前,会先穿过管道

settings.py:全局爬虫的配置文件,一般用于设置反反爬虫措施,数据库配置

scrapy.cfg:用于部署爬虫项目到服务器中

  • 然后打开pycharm自带的终端,输入scrapy genspider 要创建的文件名 域名,如下图所示,左边的项目结构会生成一个名为baidu的文件

 

猜你喜欢

转载自blog.csdn.net/qq_41949802/article/details/81334406