Supervised, Unsupervised, and Reinforcement Learning

业界资讯 2023-08-19 17:32:27 阅读次数: 0

作者：禅与计算机程序设计艺术

1.简介

机器学习是一个正在蓬勃发展的领域，它涉及到从数据中提取信息并对其进行分析、预测和决策等任务。在过去几年里，随着大数据的爆炸式增长和计算能力的快速增长，机器学习得到了越来越广泛的应用。其中，监督学习、无监督学习和强化学习都是最重要的三种机器学习方法。本文将对这三种机器学习方法做详细阐述，包括它们之间的区别、应用场景、主要特点和优缺点，并给出一些具体的算法实现。最后，还会讨论未来的研究方向和挑战。本文假定读者对机器学习有一定了解，熟悉一些基本的统计知识。

2.监督学习

2.1 概念定义

监督学习（Supervised learning）是指由训练数据中的输入-输出对组成的数据集训练出的模型能够对新的输入数据进行正确的预测或分类。在监督学习中，训练数据集中的每一个输入样本都被标记上相应的输出类别或值。监督学习的目的是找到合适的模型，能够使得模型对于输入的特征能够准确预测相应的输出值。如下图所示：

2.2 算法流程

监督学习算法一般分为两步：

训练阶段：对训练数据集进行训练，得到一个函数或模型，该函数或模型能够根据输入的特征映射到正确的输出值。
测试阶段：用训练好的模型或函数对测试数据集进行测试，评估模型或函数的性能，判断模型或函数是否可以用于实际的问题。

2.2.1 回归问题

回归问题是在给定输入数据预测一个连续实值的任务，如价格预测、销量预测等。回归问题的算法流程如下图所示：

猜你喜欢

转载自blog.csdn.net/universsky2015/article/details/132383766

Supervised, Unsupervised, and Reinforcement Learning

supervised learning|unsupervised learning

吴恩达Coursera, 机器学习专项课程, Machine Learning：Unsupervised Learning, Recommenders, Reinforcement Learning第...

如何区分监督学习(supervised learning)和非监督学习(unsupervised learning)

1.ML-监督学习(supervised learning)与无监督学习(unsupervised learning)

CAPES:Unsupervised Storage Performance Tuning Using Neural Network-Based Deep Reinforcement Learning

InfoGraph方法部分（Unsupervised and Semi-supervised Graph-Level Representation Learning via Mutual Info）

Supervised Learning

Introduction - Unsupervised Learning

Unsupervised Learning: Word Embedding

Reinforcement Learning(001)

Introduction to Reinforcement Learning

reinforcement-learning-1

Reinforcement Learning——MDP

Tutorials on Inverse Reinforcement Learning

A Distributional Perspective on Reinforcement Learning

Reinforcement Learning 增强学习

Robust Adversarial Reinforcement Learning

Control of a Quadrotor with Reinforcement Learning

Reinforcement Learning NOTE

Policy in Reinforcement Learning

Reinforcement Learning Cheatsheet

Reinforcement Learning 笔记（1）

Reinforcement Learning 笔记（3）

Reinforcement Learning 笔记（4）

【ML】Reinforcement Learning

Discovering Reinforcement Learning Algorithms

Reinforcement Learning, Fast and Slow

Relational Reinforcement Learning: An Overview

Theory of Reinforcement Learning

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)