机器学习的三种方式 - 代码天地

机器学习的三种方式

其他 2020-03-20 10:36:41 阅读次数: 0

监督学习、无监督学习、强化学习

强化学习

举例1

• 强化学习的思路和人比较类似，是在实践中学习
• 比如学习走路，如果摔倒了，那么我们大脑后面会给一个负面的奖励值 =>这个走路姿势不好；如果后面正常走了一步，那么大脑会给一个正面的奖励值 =>这是一个好的走路姿势

举例2:

• 强化学习没有教师信号，也没有label，即没有直接指令告诉机器该执行什么动作
• 反馈有延时，不能立即返回
• 输入数据是序列数据，是一个连续的决策过程

比如AlphaGo下围棋的Agent，可以不使用监督学习：
请一位围棋大师带我们遍历许多棋局，告诉我们每个位置的最佳棋步，这个代价很贵expe nsive

• 很多情况下，没有最佳棋步，因为一个棋步的好坏依赖于其后的多个棋步
• 使用强化学习，整个过程唯一的反馈是在最后（赢or输）

与监督学习的区别

没有监督学习已经准备好的训练数据输出值，强化学习只有奖励值，但是这个奖励值和监督学习的输出值不一样，它不是事先给出的，而是延后给出的（比如走路摔倒）

与非监督学习的区别

在非监督学习中既没有输出值也没有奖励值的，只有数据特征，而强化学习有奖励值（为负是为惩罚），此外非舰队学习与监督学习一样，数据之间也都是独立的，没有强化学习这样的前后依赖关系

一析合

发布了79 篇原创文章 · 获赞 14 · 访问量 2万+

私信关注

猜你喜欢

转载自blog.csdn.net/qq_38689232/article/details/104486675

机器学习的三种方式

【03】机器学习的三种范式

时序预测的三种方式：统计学模型、机器学习、循环神经网络

问答机器人三种实现方式

SpringBoot入门学习（三）~~ SringBoot启动的三种方式

（三）三种数据解析方式学习

学习机器学习的三种境界

机器学习——决策树1（三种算法）

遍历的三种方式

tomcat 三种方式

DevOps的三种方式

三种继承方式

三种排序方式

结构的三种方式

定时三种方式

三种存储方式

三种部署方式

三种nat方式

三种交换方式

Spring学习笔记（6）——IoC的三种注入方式

Spring学习（二）依赖注入的三种方式

Spring学习-创建Bean的三种方式

Python学习之路（1）--python运行三种方式

Activiti学习（二）——部署流程资源的三种方式

Selenium学习之==>三种等待方式

javaweb学习-虚拟主机配置的三种方式

Spring学习之实例化bean的三种方式

hive入门学习：join的三种优化方式

【Java学习笔记】多线程的三种实现方式

mybatis学习四 mybatis的三种查询方式

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)