机器学习实战笔记（一）

编程语言 2019-02-22 12:00:52 阅读次数: 0

Section 1 分类

监督学习：从输入模型中预测合适的模型，从中计算出目标变量。必须知道预测什么，即目标变量的分类信息。
目标变量分为标称型和数值型两类，在第一部分分类当中研究标称型的目标变量。

1. 机器学习基础

1.1 何谓机器学习

简单来说，机器学习就是把无序的数据来转化为有用的信息。
例子：专家系统。
测量所有可测属性（特征），然后从中挑选出重要部分。
算法训练，学习如何分类。输入大量已分类样本作为算法的训练集。
为了测试机器学习算法的效果，通常使用两套独立的样本集：训练集和测试集。用后者来计算算法的计算精度。
知识表示

1.3 机器学习的任务

1.4 选择合适的算法

需要考虑：

使用机器学习算法的目的。预测目标变量的值，选择监督学习算法；进一步考虑如何目标变量类型，如果是离散型，选择分类器算法，如果是连续型，选择回归算法。否则，选择无监督学习算法，进一步分析是否将数据划分为离散的组，如果是选择聚类算法，如果还需求估计数据与每个分组的相似程度，选择密度估计算法。
需要分析和收集的数据是什么。数据是离散性还是连续型；是否存在缺失值和异常值等等。

不存在最好的算法，需要反复试错。

1.4 机器学习算法的步骤

收集数据
准备输入数据。即处理数据的格式以及数据类型。
分析输入数据。目的是确保数据集中没有垃圾数据，检验数据集中是否存在空值和异常值，如果存在，需要采用方法及进行处理。检验的方法最简单的就是打开数据文件进行观察，可以采用简单图形化的形式比较直观的观察，也可以借助python中的库来进行检查。
训练算法。如果使用无监督学习算法，则跳过该步。
测试算法。如果不满意算法的输出结果，那么跳回第四步，进行改正和重新测试；也有可能是数据的准备出现问题，那么跳回第一步重新收集数据。

2. k-近邻算法

2.1 k-近邻算法概述

k-近邻算法采用测量不同特征值之间的距离方法进行分类。
优点在于精度高、对于异常值不敏感、无数据假定输入。缺点在于计算复杂度和空间复杂度高。适用于数值型和标称型。

猜你喜欢

转载自blog.csdn.net/Rosalind_Xu/article/details/87855794

《机器学习实战》笔记（一）

机器学习实战笔记（一）

《机器学习实战笔记》（一）

机器学习实战——学习笔记(一)

机器学习实战笔记（一）KNN算法

《python与机器学习实战》笔记(一)

机器学习实战-读书笔记(一)

机器学习实战笔记（一）机器学习的理论基础

机器学习实战笔记

【机器学习实战】笔记

机器学习实战——学习笔记

《机器学习实战》学习笔记

《机器学习实战》学习笔记一：K近邻算法

《机器学习实战》学习笔记Part 1（一）

《机器学习实战》学习笔记一：K邻近算法

《机器学习实战》学习笔记（一）：k-近邻算法

机器学习实战学习笔记（一）：KNN算法

【机器学习】《机器学习实战》笔记

《机器学习实战》笔记（一）：K-近邻算法

机器学习笔记（九）：Tensorflow 实战一（Tensorflow入门）

机器学习实战——笔记（第一章）

机器学习实战笔记（1）

机器学习实战笔记——PCA

机器学习实战笔记——AdaBoost

《机器学习实战》阅读笔记

机器学习实战笔记：回归

《机器学习实战》笔记（二）

机器学习实战笔记-KNN

机器学习实战笔记：AdaBoost

《机器学习实战》笔记（一）：Ch1 - 机器学习基础

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)