二数据2 - 代码天地

二数据2

其他 2018-11-12 10:10:45 阅读次数: 0

2.3数据预处理

2.3.1 聚集

聚集是将两个或多个对象合并成为单个对象。

2.3.2 抽样

抽样是选择数据对象子集进行分析的方法。
1.抽样方法：简单随机抽样；分层抽样
2.渐进抽样

2.3.2 维规约

1.维灾难
2.维规约的线性代数技术

2.3.4 特征子集选择

嵌入方法，过滤方法，包装方法
1.特征子集选择体系结构
在这里插入图片描述
2.特征加权

2.3.5 特征创建

1.特征提取：创建新的特征集
2.映射数据到新的空间：变换
3.特征构造：特征之间数学组合

2.3.6 离散化和二元化

1.二元化
2.连续属性离散化:非监督离散化，监督离散化
3.具有过多值的分类属性

2.3.7 变量变换

1.简单函数
2.规范化或标准化：使整个值的集合具有特定的性质

2.4 相似性和相异性的度量

2.4.1 基础

1.定义：在这里插入图片描述
2.变换：相似度区间转换到[0,1]，相似度和相异度之间的转化

2.4.2 简单属性之间的相似度和相异度

在这里插入图片描述

2.4.3 数据对象之间的相异度

距离：在这里插入图片描述

2.4.4 数据对象之间的相似度

2.4.5 临近性度量的例子

1.二元数据的相似度度量
相似系数
在这里插入图片描述
简单匹配系数：
Jaccard系数：（非对称属性）

2.余弦相似度（处理非二元属性）

3.广义Jaccard系数

4.相关性
两个具有二元变量或连续变量的数据对象之间的相关性是对对象属性之间线性联系的度量。相关度[-1,1]，线性关系的描述
皮尔森相关系数：
在这里插入图片描述
Bregman散度：一族具有共同性质的近邻函数。（没太懂用来干嘛的）

2.4.6邻近度计算问题

1.距离度量的标准化和相关性
属性具有不同的值域时如何处理问题。
在这里插入图片描述
2.组合异种属性的相似度

3，权值

2.4.7 选取正确的近邻性度量

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/DMU_lzq1996/article/details/83927093

二数据2

Redis学习（二）—— 数据类型（2）

2.二进制数据

二 Struts2 接收数据

2_数据库(二)

大数据（二）flink 2 代码demo

【2】数据通信基础（二）

数据结构2 树与二叉树

Struts2学习（二）数据封装机制

SQL 实验二数据查询（Part 2）

Struts2请求动作的数据操作---ValueStack 之二

Android基础(二)数据存储2.SQL存储

漫谈数据结构(二)——线性表2

Struts2的API&数据封装（二）

关于I2C（二）：数据传输

UReport2报表引擎：数据源配置（二）

MapReduce数据分析（2）二次排序

Vue2.x 源码学习（二） - 数据驱动

数据结构二模热身题（2）

Yii2框架（二）数据库相关操作

[阶段二] 2. 数据库的基本查询

Vue2响应式原理（二）数据代理

二叉树(2)--------数据结构

JavaWeb上机实验2 数据库访问（二）

【数据结构】二叉树详解(2)

数据结构-二叉树（2）

数据结构--二叉树（2）

java数据结构总结(二)--二叉树遍历2

二、MySql数据操作（二）

Struts2第二天：Struts2的数据的封装、结果页面配置

今日推荐

周排行

【转】mongodb中删除数组内嵌对象文档

php数字金额转换成中文大写显示

枫神之路--Java 的继承机制

四、Spring中使用@Conditional按照条件注册Bean

tomcat中直接使用第3放jar包

进程的创建fork vs vfork

结构体和组合体

“无任何网络提供程序接受指定的网络路径”的解决办法

webpack配置vue项目引入和部分引入

Oracle在不同windows系统中的迁移

每日归档

更多

2024-06-14(0)

2024-06-13(0)

2024-06-12(0)

2024-06-11(0)

2024-06-10(0)

2024-06-09(0)

2024-06-08(0)

2024-06-07(0)

2024-06-06(0)

2024-06-05(0)