python 爬虫(二) 使用scrapy初始化一个爬虫 - 代码天地

python 爬虫(二) 使用scrapy初始化一个爬虫

其他 2018-07-12 18:29:14 阅读次数: 0

1.使用spyder 新建一个空项目
2.在Anaconda Prompt下进入项目所在目录输入 scrapy startproject [项目名]
将会生成如下目录结构
spiders 里边主要放我们的爬虫文件现在还没有
items.py里边写我们要保留的字段就是爬到的那些数据要存
middlewares.py 中间件用于扩展Scrapy功能进阶只是前期并不是很需要
pipelines.py主要用于文件储存
settings.py 放一些全局设置用到的时候慢慢解释
3. 在spiders 中新建一个爬虫文件 sina.py

import scrapy
class sinaSpider(scrapy.Spider):
    name='sina' #爬虫的名字
    allowed_domains='tech.sina.com.cn';  #爬虫的域名
    start_urls=['http://tech.sina.com.cn/focus/finance_report/?qq-pf-to=pcqq.c2c'] #爬虫的初始url 入口

    def parse(self, response): #默认的回调处理函数 
        u=response.body
        print(u)

爬虫会从start_urls 开始获取响应获取到响应之后进入 parse 处理

4.在命令行下输入

scrapy crawl sina

即可看到控制台输出获取的html

猜你喜欢

转载自blog.csdn.net/lkjasdgfh/article/details/80188592

python 爬虫(二) 使用scrapy初始化一个爬虫

使用python的scrapy来编写一个爬虫！

Python爬虫，利用scrapy来编写一个爬虫！

python 爬虫scrapy框架（二）

Python爬虫框架Scrapy入门（二）第一个爬虫程序：使用xpath爬取起点中文网

Python爬虫学习（二）

python爬虫二

python爬虫（二）

python 爬虫初探二

python爬虫系列（二）

Python 爬虫 (二)

《python初级爬虫》（二）

python爬虫笔记（二）

PYTHON爬虫（实战二）

python网络爬虫二

Python爬虫学习二

Python爬虫之二

python爬虫(二)-------------------Xpath

Python爬虫(二) | requests

python爬虫入门（二）

Python爬虫--Xpath（二）

Python爬虫——案例（二）

Python爬虫实战（二）

python爬虫学习(二)

scrapy爬虫框架（二）：创建一个scrapy爬虫

Python Scrapy 爬虫（二）：scrapy 初试

python之Scrapy框架的第一个爬虫

Python爬虫（二）网络爬虫的尺寸与约束

Python 爬虫（二）爬虫基本入门

python | 爬虫笔记（二）- 爬虫基础

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

Java基础复习_day13_Collection集合

2018.11.16 c语言学习经验

且看Java内置四大核心函数式接口

小程序云开发中数据库的数据分段和显示图片

python的函数

Web-JS进阶

【干货】C++常用代码积累笔记大全

Spring的ioc操作与 IOC底层原理

构建之法20191121-11 Scrum立会报告+燃尽图 07

Spring boot之Hello World访问404

每日归档

更多

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)