python scrapy crawl xxx -o xx.json json中没有数据 - 代码天地

python scrapy crawl xxx -o xx.json json中没有数据

其他 2018-11-18 10:10:57 阅读次数: 0

python scrapy crawl xxx -o xx.json json中没有数据

有两个原因
没有配置管道文件，在setting.py中配置
其一：

# 管道文件配置，BossPipeline是pipelines.py中的类名
ITEM_PIPELINES = {
   'boss.pipelines.BossPipeline': 300,
}

其二：爬虫文件中 def parse(self, response):没有返回值

    def parse(self, response):
         # 匹配所有工作相关信息
        job_list = response.xpath('//div[@class="info-primary"]')
         items_list = []

        for info in job_list:
            # Item对象用来保存数据的
            item = BossItem()
            '''
            工作相关信息
            '''
            # 岗位名称
            # 加extract()，提取xpath匹配的内容，不加extract()，匹配的是对象
            name = info.xpath('./h3/a/div[@class="job-title"]/text()').extract()
            # 待遇
            money = info.xpath('./h3/a/span[@class="red"]/text()').extract()
            item['name'] = name[0]
            item['money'] = money[0]
            items_list.append(item)
            #必须要有返回值，把结果返回给管道处理
        return items_list

猜你喜欢

转载自blog.csdn.net/ithongchou/article/details/83862732

python scrapy crawl xxx -o xx.json json中没有数据

scrapy crawl app -o file.json导出文件中文编码\u问题

Python.错误解决：scrapy 没有crawl 命令

Python爬虫：Scrapy中runspider和crawl的区别

在js中，xx.json文件格式

python3.7 scrapy crawl name 报错

python3.7 scrapy crawl 报错

python scrapy错误xxx is not JSON serializable解决办法

读取xx.json文件为json字符串

Python数据爬虫学习笔记（17）Scrapy糗事百科Crawl自动爬虫

python3.7学习scrapy crawl MySpider报错

Crawl a website with scrapy

创建crawl—scrapy

scrapy crawl xxx,import win32api ModuleNotFoundError: No module named 'win32api'

解决scrapy框架命令执行(scrapy crawl xx)代码报错问题

scrapy 4 学习 crawl spider

PYTHON3.7 SCRAPY CRAWL 运行出错解决方法SyntaxError: invalid syntax

菜鸟写Python-Pycharm执行Scrapy项目报：Scrapy-no active project 和（或）Unknown command: crawl错误

spider crawl xxx.jsonlines 编码乱码

关于在cmd命令行中执行 scrapy crawl demo 出现错误

关于开源框架Scrapy运行命令Crawl

scrapy crawl spider执行报错(windows)

Scrapy tutorial and practise-crawl job webste

python爬虫执行scrapy crawl demo出现： import win32api ModuleNotFoundError: No module named 'win32api'错误

Python3 Scrapy框架学习五：使用crawl模板爬取豆瓣Top250，并存入MySql、MongoDB

JSON parse error: Unrecognized field “xxxx“ (classxxxx.xxx.xxx.xx JSON报错

JSON Property 'xxx' has no getter method in class 'class xx

Python中name '__XX__' is not defined或显示Unresolved reference ' XXX '

在使用scrapy爬虫的过程中，在命令控制台输入scrapy crawl 项目名出现报错：ModuleNotFoundError: No module named 'win32api'

[Python]json 错误xx is not JSON serializable

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)