关于scrapy - 代码天地

关于scrapy

其他 2019-04-17 20:14:46 阅读次数: 0

对于anaconda与pycharm，因为在pycharm中一直下不成功tensorflow，所以后来又下了anaconda，pycharm就可以直接使用anaconda的编译器，

一直都很正常，但是，就scrapy而言，在anaconda成功使用，但是，pycharm就不成功，一直显示不存在该包。

就只能用pycharm上修改代码，anaconda的prompt下执行代码。

1、在终端输入scrapy startproject XX，就表明在该包下创建scrapy项目XX

2、输入scrapy genspider news www.baidu.com，就是表明要爬www.baidu.com，同时在scrapy项目下的spiders新建news.py

3、终端中执行的代码为scrapy crawl news

4、如果想要爬网站，最好将项目中setting.py中

ROBOTSTXT_OBEY变为False,

为了查看更方便可以增加， LOG_LEVEL='WARNING'

为了访问网站成功，将DEFAULT_REQUEST_HEADERS中增加User-Agent

5、可以将start_urls改为真正想要访问的网站，上面创建时的网站，只是域网。

6、执行，在终端中输入scrapy crawl new

猜你喜欢

转载自www.cnblogs.com/wzwi/p/10725746.html

关于scrapy

scrapy

关于Python 的Scrapy简介

1-Scrapy Tutorial

1.Scrapy at a glance

3.Scrapy Tutorial

1.scrapy爬虫

scrapy中关于ItemLoader的使用

关于scrapy流程的总结分析

关于scrapy爬虫的小知识

关于scrapy-redis的问题

关于scrapy的posgresql插入问题

简书关于scrapy的叙述

二(1.scrapy)Scrapy--item

Scrapy框架----04Scrapy Shell

关于scrapy中scrapy.Request中的属性

scrapy 关于 rule, 关于多页

Scrapy终端（Scrapy shell）

scrapy程序（scrapy）

scrapy的xpath，scrapy shell

scrapy 初识 scrapy框架

Scrapy框架 Scrapy框架

scrapy的使用-scrapy shell

Scrapy：Scrapy shell

关于[scrapy] DEBUG:Filtered duplicate request:

关于在windows 下安装scrapy的问题

Python爬虫：关于scrapy模块的请求头

关于开源框架Scrapy运行命令Crawl

关于scrapy的一些练习

关于Scrapy crawlspider rules的规则——翻页

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)