大数据处理的基本算法

其他 2020-02-14 11:23:17 阅读次数: 0

课程地址：http://www.auto-mooc.com/mooc/detail?mooc_id=BA91C867A68E92651FBF224828ECAE6E&major_id=E1007D8658541BD264785AA3709ADA25

这是笔记！

1.0数据基本算法

1.1聚类算法

类：相似元素的集合。

分类

是事先定义好类别，类别数固定；按照某种标准给队形贴标签，再根据标签来区分归类。

聚类

是没有事先预定的类别，类别数不确定。聚类不需要人工标注和事先训练分类器，类别再聚类过程中自动生成。
在这里插入图片描述

K-means聚类算法

K均值聚类算法。
在这里插入图片描述

步骤：1、首先随机确定质心，图b；2、计算样本到质心的距离；3、将样本聚类，图c；4、重新计算聚类后，各自的质心，图d；5、执行第2步，循环。

在这里插入图片描述

SOM聚类

在这里插入图片描述

KNN与K-means区别

参考：https://www.tuicool.com/articles/qamYZv

在这里插入图片描述
KNN的算法过程是是这样的：

从上图中我们可以看到，图中的数据集是良好的数据，即都打好了label，一类是蓝色的正方形，一类是红色的三角形，那个绿色的圆形是我们待分类的数据。

如果K=3，那么离绿色点最近的有2个红色三角形和1个蓝色的正方形，这3个点投票，于是绿色的这个待分类点属于红色的三角形。

如果K=5，那么离绿色点最近的有2个红色三角形和3个蓝色的正方形，这5个点投票，于是绿色的这个待分类点属于蓝色的正方形。

我们可以看到，KNN本质是基于一种数据统计的方法！其实很多机器学习算法也是基于数据统计的。
在这里插入图片描述

聚类性能度量

在这里插入图片描述

距离计算：

在这里插入图片描述

马氏距离（雷达的聚类是什么搞得？？？待会学习一下）

1.2降维算法

在这里插入图片描述

在这里插入图片描述

协方差矩阵？？？（待会学习一下）

在这里插入图片描述

1.3回归算法

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

发布了30 篇原创文章 · 获赞 3 · 访问量 1万+

私信关注

猜你喜欢

转载自blog.csdn.net/djfjkj52/article/details/104307351

大数据处理的基本算法

大数据处理基本过程

大数据处理的基本流程

大数据处理相关算法

大数据处理

大数据——海量数据处理的基本方法总结

大数据处理的基本流程是什么？

大数据处理技术，主要包括哪些基本技术？

大数据处理 | Spark集群搭建及基本使用

谈谈对大数据、大数据处理框架、大数据处理算法的理解和认识

算法原理：大数据处理的分治思想！

大数据处理培训：大数据处理流程

大数据处理文章

db大数据处理

大数据处理-序

JXL大数据处理

大数据处理优化

大数据处理流程

大数据处理方案

浅谈大数据处理

大数据处理Pig

大数据处理架构

Spark大数据处理

大数据处理相关

大数据处理框架

excel 大数据处理

大数据处理思路

大数据战疫情｜讲述大数据处理和应用中相关算法设计与分析

大数据处理的基本流程：数据抽取与集成+数据分析+数据解释

【大数据】海量数据处理方法

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)