数据挖掘导论笔记1——第二章：数据 - 代码天地

数据挖掘导论笔记1——第二章：数据

编程语言 2018-06-03 18:00:30 阅读次数: 0

鲁棒算法

--有噪声也可以产生可接受的结果。

使用【特征、变量】替代【属性】。

数据预处理

1.特征子集选择

2.特征提取：

由原始数据创建新的特征集。

3.将特征映射到新空间

4.特征构造：

由一个或者多个原始特征构造新的特征。

5.二元化

6.非监督离散化

7.具有过多值的分类属性

二、相似性和相异性的度量

1.距离

参考：数学中常见的距离

https://blog.csdn.net/Losteng/article/details/50893931

2.非度量的距离--集合差、时间

度量：

3.相关性

只能检查是否存在线性相关，（-1，1）；若为0，则不存在线性相关，有可能由非线性相关。

4.相似系数

5.Bregman散度

6.mahalanobish距离

7.非对称属性

只有非零属性值才重要的属性称为非对称属性，比如二元属性，当考虑普通人的患癌情况时，健康时属性为0，患癌时为1，这样大部分情况下该属性都为0，因此我们一般只关注属性为1的情况，所以这个就是非对称的二元属性。

8.组合异种属性的相似度：

如果两个对象非对称属性上的值都为0，则计算相似度时忽略他们，可以很好地处理遗漏值

*不懂

猜你喜欢

转载自blog.csdn.net/wangdi_37927/article/details/80542560

数据挖掘导论笔记1——第二章：数据

数据挖掘导论课后习题答案-第二章

数据挖掘概念与分析第二章笔记

《数据挖掘概念与技术》学习笔记-第二章

数据挖掘day18、19-《数据挖掘导论》-第一章，第二章

学习笔记(70):第二章：海量数据的处理与挖掘-关联规则挖掘01

数据结构导论-第二章

数据挖掘读书笔记--第二章：认识数据

数据挖掘学习笔记-第二章数据预处理

数据仓库与数据挖掘学习笔记第二章联机分析处理

算法导论第二章笔记

《算法导论》第二章笔记

数据挖掘导论学习笔记1（第1 、2章）

数据挖掘习题选做--第二章

Python数据分析与挖掘实战——第二章

(算法导论)第二章笔记2：算法基础

算法导论学习笔记第二章算法基础

慕课笔记-数据科学导论-第二章大数据技术基础-大数据算法/数据类型/开发流程

《python数据分析与挖掘实战》第二章 python数据分析简介

【数据挖掘与商务智能决策】第二章特征工程与数据预处理

第二章数据的图表展示1 - matplotlib库

数据结构-第二章（1）-线性结构

数据结构导论 - 第二章线性表

数据结构导论(第二章线性表）

数据结构导论之第二章(线性表)

机器学习与数据挖掘-作业二-第二章模型评估与选择

「笔记」《大话数据结构》第二章：算法

数据库笔记【第二章】

数据结构笔记第二章

数据库笔记第二章

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)