scrapy爬虫框架学习 - 代码天地

scrapy爬虫框架学习

其他 2018-07-12 14:31:54 阅读次数: 0

找到一个有关历史名人的网站：http://ren.bytravel.cn/ 网站地区分门别类很整齐，找到上饶地区，在一个名叫basic的爬虫代码里，start_url 里填写的就是这个网址：http://ren.bytravel.cn/Celebrity/index408_list.html

用scrapy爬取其中上饶籍的历史名人

首先，scrapy startproject shangraorenwucrawl 创建了一个scrapy项目

然后，这个scrapy项目的文件夹就建立好了，进入其中，写item.py 这个文件说明了你要爬取的item，这个item就像python里的字典，或者就像一张二维表，你定义要爬取的内容

然后，写setting.py 这个文件是scrapy的一些设置，在文件末尾添加了几行设置爬虫以浏览器名义执行request的语句，还有设置文件格式utf-8 等等

然后，在spider目录里新建爬虫py，你可以在命令行里，scrapy genspider basic web，这个basic爬虫是scrapy自带的模板，web是你允许爬虫去爬的域名，比如：ren.bytravel.cn

然后，写这个basic爬虫喽，找xpath，写爬虫

然后，写好爬虫，scrapy crawl basic 运行这个爬虫，你可以在命令行后面加 -s CLOSESPIIDER_ITEMCOUNT=60 这个是设置可以加 -o item.json 这样就把输出保存为json文件，当然也可以保存为csv文件

Duang的一下这个爬虫就OK了

GitHub地址：https://github.com/maoyuqing/shangraorenwucrawl

猜你喜欢

转载自www.cnblogs.com/MaoYQ/p/9299223.html

scrapy爬虫框架学习

学习随笔 Scrapy爬虫框架

python爬虫框架——Scrapy学习

Scrapy框架爬虫学习--2

Scrapy框架爬虫学习--1

爬虫框架Scrapy学习（一）

Python Scrapy爬虫框架学习

python爬虫框架Scrapy学习

爬虫Scrapy框架学习（一）

爬虫scrapy框架学习（三）

爬虫scrapy框架学习（二）

Scrapy爬虫框架学习一

学习笔记 scrapy 爬虫框架

Python学习---爬虫学习[scrapy框架初识]

【python学习】scrapy爬虫框架学习

爬虫学习之scrapy框架入门

Python爬虫框架Scrapy学习笔记原创

网络爬虫Scrapy框架学习2

网络爬虫Scrapy框架学习1

Python爬虫框架Scrapy学习笔记

Python学习笔记——爬虫之Scrapy框架

大数据-爬虫框架学习--scrapy

学习Python爬虫必备框架：Scrapy

Scrapy爬虫框架学习之XPath

Scrapy爬虫框架学习之Response对象

Python爬虫框架scrapy简单学习

《精通Python爬虫框架Scrapy》学习资料

Python 爬虫框架Scrapy Spiders学习

python学习之Scrapy爬虫框架

pyhton爬虫学习（十三）：scrapy框架原理

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

Java基础复习_day13_Collection集合

2018.11.16 c语言学习经验

且看Java内置四大核心函数式接口

小程序云开发中数据库的数据分段和显示图片

python的函数

Web-JS进阶

【干货】C++常用代码积累笔记大全

Spring的ioc操作与 IOC底层原理

构建之法20191121-11 Scrum立会报告+燃尽图 07

Spring boot之Hello World访问404

每日归档

更多

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)