机器学习概述一 - 代码天地

机器学习概述一

其他 2020-08-04 17:46:53 阅读次数: 0

机器学习定义

根据已有的数据，建立更加符合现实的模型，用以预测未来的趋势。
对于某给定的任务T，在合理的性能度量方案P(模型准确率)的前提下，某计算机程序可以自主学习任务T的经验E(历史数据);随着提供合适、优质、大量的经验E，该程序对于任务T的性能逐步提高。

机器学习基本概念

拟合：构建的算法符合给定数据的特征
$x^i$ ：表示第i个样本的x向量，即矩阵的行
$x_i$ ：x向量的第i维度的值，即矩阵的列
鲁棒性：系统的健壮性，鲁棒性越高则健壮性越强
过拟合：算法太符合样本数据的特征，对于实际生产中的数据特征无法拟合
欠拟合：算法不太符合样本的数据特征

机器学习分类

有监督学习

用已知某种或某些特性的样本作为训练集，以建立一个数学模型，再用已建立的模型来预测未知的样本，是最常用的一种机器学习方法。是从标签化训练数据集中推断出模型的机器学习任务。

无监督学习

样本数据集中无明显的数据特征，使用一定的数学模型，推断出数据的一些内在数据结构。

半监督学习

考虑如何利用少量的标注样本和大量的未标注样本进行训练和分类的问题，是有监督学习和无监督学习的结合

有监督学习

判别式模型

直接对条件概率 $P(y|x)$ 进行建模，常见的判别模型有：线性回归、决策树、支持向量机SVM、k近邻、神经网络等。

生成式模型

对联合分布概率 $P(x,y)$ 进行建模，常见的生成式模型：隐马尔可夫模型HMM，朴素贝叶斯模型，高斯混合模型GMM，LDA等

两者比较：

生成式模型关注数据是如何产生的，能够得到数据的模拟分布，寻找的是数据分布模型；判别式模型关注数据的差异性，寻找的是分类面
由生成式模型可生成判别式模型，但由判别式模型无法生成生成式模型
生成式模型更具普适性；判别式模型更直接，目标性更强

无监督学习

无监督学习试图学习或提取数据背后的数据特征，或从数据中抽取出重要的数据特征信息，常见的算法有：聚类、降维、文本处理(特征抽取)等。
无监督学习往往是作为有监督学习的前期数据处理，功能是从原始数据中抽取出必要的数据信息。

猜你喜欢

转载自blog.csdn.net/yangjiajia123456/article/details/84727125

一、机器学习概述

机器学习概述一

机器学习（一）：概述

机器学习一 ——机器学习概述

机器学习笔记一：概述

机器学习（概述一）——定义

《机器学习》学习笔记（一）——机器学习概述

机器学习实践（一）—sklearn之概述

机器学习（聚类一）——概述

机器学习（KNN一）——原理概述

机器学习作业一 1. 机器学习概述

机器学习笔记（一）：机器学习基本知识概述

【机器学习】机器学习概述

机器学习笔记-概述

机器学习概述

机器学习笔记------概述

机器学习领域概述

机器学习 01 概述

机器学习篇（概述）

00 - 机器学习概述

机器学习概述

机器学习简要概述

04机器学习概述

机器学习（1）- 概述

1、机器学习概述

01 机器学习概述

机器学习概述二

机器学习之概述

机器学习算法概述

机器学习（一）：统计学习问题概述

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)