Python实战演练之数据过滤 - 代码天地

Python实战演练之数据过滤

其他 2020-04-30 11:59:03 阅读次数: 0

上章回顾

从上一章Python实战演练之数据导出中最后导出的数据表中有None的存在，它们是免费课程，这不是我们所需要的内容，所以对其进行数据过滤，保证获取数据的完整。

开启EducsdnPipeline

在settings中开启EducsdnPipeline

ITEM_PIPELINES = {
    # 为了做数据过滤，凡是要经过 MysqlPipeline的先经过 EducsdnPipeline
    # 先在EducsdnPipeline中进行过滤，MysqlPipeline就不会储存
    'educsdn.pipelines.EducsdnPipeline': 300,
    'educsdn.pipelines.MysqlPipeline': 301,
}

重写

重写pipelines.py中的EducsdnPipeline，将价格为None的数据过滤掉。

import pymysql
from scrapy.exceptions import DropItem

class EducsdnPipeline(object):
    def process_item(self, item, spider):
        if item['price'] == None:
            raise DropItem("drop item")
        else:
            return item

MysqlPipeline不做改变，和前文一致

清空表数据
再次在终端执行：

educsdn $ scrapy crawl courses

在这里插入图片描述
price == None 的数据已经被清理掉了。

fswy

原创文章 214 获赞 359 访问量 89万+

关注他的留言板

猜你喜欢

转载自blog.csdn.net/yxys01/article/details/104648136

Python实战演练之数据过滤

Python实战演练之数据导出

python之Socket TCP实战演练

Python实战演练之scrapy初体验

Python实战演练之全国地震预警

Python爬虫、数据分析实战演练

实战演练Python数据分析[pandas]

Python实战演练之跨页爬取

Python实战开发演练之牲畜智能饮水机

python实战演练之鸡尾酒舞游戏

Python_实战演练_数据缺失值处理

Python实战演练之python实现神经网络模型算法

Python实战演练之Python实现一个简单的天气查询应用

python实现队列---附加实战演练

python实战演练（一）登录接口程序

Python 单元测试实战演练

python os库基础实战演练

python实战演练之迎接冬至的第一场雪

Hive数据分析实战演练

实战演练 | Navicat 数据生成功能

SQL Server数据库进阶之表分区实战演练

SQL Server数据库高级进阶之索引维护实战演练

项目实战-大数据Kafka原理剖析及（实战）演练

python爬虫入门之————————————————案例演练

「玩转 TableAgent 数据智能分析」实战数据分析演练

【实战演练】Python+Django网站开发系列06-django数据库创建与使用

SpringBoot系列之xml传参与返回实战演练

C语言实战演练之贪吃蛇游戏

C语言实战演练之游戏框架

JAVA实战演练之自动驾驶系统

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)