参数 | 说明 | 示例 |
---|---|---|
name | 爬虫名称,必须唯一 | name = “myspider” |
handle_httpstatus_list | 需要处理的状态码 | handle_httpstatus_list = [404] |
download_delay | 下载延时(单位:s秒) | download_delay = 5 |
allowed_domains | 域名限制 | allowed_domains = [“baidu.com”] |
custom_settings | 用户设置,单独设置爬虫参数 | custom_settings ={‘RETRY_TIMES’: 3} |
start_urls | 起始链接设置 | start_urls = [“http://www.baidu.com“] |
Python爬虫:scrapy框架Spider类参数设置
猜你喜欢
转载自blog.csdn.net/mouday/article/details/80674464
今日推荐
周排行