如何化“熵增”为“熵减”，数据质量管理尤为重要 - 代码天地

如何化“熵增”为“熵减”，数据质量管理尤为重要

业界资讯 2023-04-06 18:03:29 阅读次数: 0

“熵”是热力学第二定律的核心概念，熵其实就是指的“混乱程度”，简单来说熵是衡量我们这个世界中事物混乱程度的一个指标。在一个孤立系统中它的总混乱度（熵）是不会减小的，也就是说如果不做任何管控，事物往往会不断的向无序发展。
其实数据也是一个不断熵增的过程，随着时间的推移会出现无效数据、错误数据、冗余数据、不规范数据、相冲突数据等。如果不好好进行管控，去减少我们数据中的“熵”，我们最后会得到一些无序低价值的数据。
如何化“熵增”为“熵减”，数据质量管理尤为重要。

下定义：解读数据质量管理
数据质量管理是对数据从计划、获取、共享、维护、应用、消亡生命周期的每个阶段里可能引发的各类数据质量问题，进行识别、度量、监控、预警等一系列管理活动，并通过改善和提高组织的管理水平使得数据质量获得进一步提高。数据质量管理是循环管理过程，其终极目标是通过可靠的数据提升数据在使用中的价值，并最终为企业赢得经济效益。
所以，数据质量是保证数据应用的基础，而要评估数据是否达到预期设定的质量要求，需要有专业权威的评价标准来约束。目前为止，最权威的标准是由全国信息技术标准化技术委员会提出的数据质量评价指标（GB/T36344-2018 ICS 35.24.01）

理框架：数据质量管理系统框架
数据质量很重要，我们知道数据存在的问题，我们也知道数据质量要符合6大评价标准，但是我们要怎么系统化建设和管理呢？数据质量管理一般以数据标准为数据检核依据，以元数据为数据检核对象，将质量评估、质量检核、质量整改与质量报告等工作环节进行流程整合，形成完整的数据质量管理闭环。

方法论：数据质量管理的四个阶段
然而，我们需要按照什么流程来对数据质量进行有效的管控，从而提升数据质量，释放数据价值？一般来讲，数据质量控制流程分为4个阶段：启动、执行、检查、处理。在管控过程中这4个阶段需不断循环，螺旋上升。

猜你喜欢

转载自blog.csdn.net/jane9872/article/details/129797120

如何化“熵增”为“熵减”，数据质量管理尤为重要

如何正确使用商超条码扫描枪？设置参数尤为重要

Python中尤为重要的数据结构（3） — 字符串

Python中尤为重要的数据结构（2）—元组和字典

Python中尤为重要的数据结构（1）—列表

构建智慧城市基础设施大数据储存尤为重要

数论夏夜实战，然夯实基础尤为重要！

1-4年的iOS开发者，如何写一份成功的简历尤为重要！

什么是熵增？如何对抗熵增？

Java架构体系学习路线图，第6点尤为重要！

Java架构体系学习路线图，这六点尤为重要！

Java架构师学习路线图，第6点尤为重要！

阿里八年Java架构工作经验，第五点尤为重要！

Java编程学习并不难，有坚持的动力与良好的心态尤为重要

Java架构体系学习路线图，第六点尤为重要！

八年Java架构学习经验总结：第六点尤为重要

十年Java架构学习经验总结:第六点尤为重要

阿里八年Java架构学习经验总结，第六点尤为重要！

阿里八年Java架构经验总结，第六点尤为重要！

物联网时代即将到来，LED显示屏内容显示安全尤为重要

半年备战六面字节，成功收获抖音offer才发现算法尤为重要

生成式AI时代的创新安全尤为重要，亚马逊云科技对这方面有考量吗？

数据质量管理

管理的本质，就是对抗 “组织熵增”

要想写出好的代码！编辑器尤为重要！俗话：工欲善其事必先利其器

阿里P8分享Java架构师的学习路线，第六点尤为重要

【本人秃顶程序员】阿里P8分享Java架构师的学习路线，第六点尤为重要

数据质量管理（二）

如何借助大数据提升医疗质量管理

反熵增思维

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)