关于监督式、无监督式算法以及强化算法的简单理解 - 代码天地

关于监督式、无监督式算法以及强化算法的简单理解

其他 2018-07-20 04:44:56 阅读次数: 0

看了一篇大神的解释，讲得很清楚，将网址附在下面：

https://medium.com/@machadogj/ml-basics-supervised-unsupervised-and-reinforcement-learning-b18108487c5a

谈谈我自己的理解：

1）.监督式算法：

具有一个标准的本体，算法通过学习对数据进行预测，从而与本体进行比较。（我知道我想要得到什么）对数据，一部分数据用于训练模型，另一部分用于比较模型的正确率，有多少的匹配度就是多少的正确率。

2）.无监督式算法：

不具有标准的本体，对于数据量庞大的数据集，我们想要找到其中隐藏的一些关系，则采用无监督式算法。需要将数据转化为一种有意义可比较的格式，最终得到的会是具有一定关系的集合。但是是否是我们想要的集合取决于我们自己。可以进行强制的删减某些数据以达到我们预期的特定分割。

3）.强化式算法：

研究试图对强化学习模型进行逆向反馈以改进问题和技术的一种算法。是一种延时的机制。是一个连续做决策的过程，在一个过程中输入的数据的返回值会影响到下一个输入数据的返回值。算法定义了reward，由于自己能够察觉到signal并进行自己定义的action，算法需要将结果与reward进行比较，最终反馈以改进模型。RL没有被严格地监督，因为它不严格地依赖于受监督(或标记)数据集(训练集)。它实际上依赖于能够监控所采取行动的反应，并根据对奖励的定义来衡量。但这也不是没有监督的学习，因为我们知道，当我们对学习者进行建模时，这就是预期的回报。

猜你喜欢

转载自blog.csdn.net/weixin_42554580/article/details/81056403

关于监督式、无监督式算法以及强化算法的简单理解

有监督算法和无监督算法的理解

无监督算法

监督式学习、非监督式学习、强化学习

监督式学习、无监督式学习、无监督式学习 --概念区分

无监督学习算法

理解监督学习、无监督学习、半监督学习、强化学习

常见的简单的无监督学习算法总结

聚类算法（无监督算法）

【IM】关于无监督降维的理解

无监督的数据挖掘算法-聚类

聚类算法--无监督学习

无监督学习--聚类算法

论文解读 | 点对照：3D点云理解无监督式预训练

机器学习实战 | 五 | 监督式学习和无监督式学习

监督式学习

文本相似度算法(无监督算法)

k均值算法——无监督学习以及地图点分类

GFK(Geodesic Flow Kernel)关于测地线核的无监督域适应算法

用PyTorch训练一个简单的K-means无监督算法机器学习模型

无监督学习下的生成式模型

有监督学习和无监督学习的简单理解

半监督的GAN算法

监督学习算法

衡量监督算法的性能

有监督&无监督

机器学习面试知识点一(无监督和有监督算法的区别)

Python 机器学习，算法分类，监督学习与无监督学习，分类与回归

机器学习算法之有监督学习和无监督学习的区别

监督学习与无监督学习和K聚类算法

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)