机器学习基础概念-阿里大学课程学习笔记 - 代码天地

机器学习基础概念-阿里大学课程学习笔记

其他 2019-09-24 22:07:59 阅读次数: 0

https://edu.aliyun.com/course/11/learn#lesson/12 的学习笔记

第一章机器学习概念、原理和应用场景

课时1 机器学习的基础概念

概述：

ArtificialIntelligence ⊆ MachineLearning ⊆ DeepLearning

AI: 1950s - now 使得机器能做一般只能由人做的事

ML:1980s - now 用经验改进性能的计算方法

DL: 2010s - now

一些例子：

垃圾邮件分类：通过词频，使用朴素贝叶斯进行垃圾邮件分类

课时2：机器学习的领域

任务判断：

1 看样本数，样本数<50需继续收集数据

2 有无label 有label，且是category，一般为分类任务

3 如果label是数值，且需要预测，一般为回归任务

4 如果label是数值，不需要预测，只是看数据，用降维合适

A

课时3：机器为什么能学习

PAC:近似相等。图片描述的是采样原理，采样样本越大，黄球比例越接近真实

直观理解为何机器能学习：类似采样统计样本比例可以猜测球的颜色占比，在独立同分布情况下，通过足够大样本学习推测映射函数h(x)，能使得h(x)接近f(x)

ERM：经验分析最小化。容易过拟合

SRM：结构风险最小化。在ERM的后面加正则项，通过惩罚的引入使得模型较为简单

欠拟合：模型太简单

过拟合：模型太复杂

房价欠拟合、适合拟合、过拟合实例

第二章机器学习常用算法

课时4 监督学习-线性回归

线性回归：

二维情况下的数据示例

图示化

二维说明

三维示例

通过损失函数评估线性回归效果

线性回归数学定义

经典机器学习的数学描述

梯度下降迭代θ。如何求二范式梯度？

上面两页推导，说明：二范式最小化，也就是数据集在受高斯噪声影响模型下的，数据集D出现概率最大化。通过数学推导证明二范式的合理性。

B

代码化的逻辑回归。矩阵如何求导？

注：我判断x[:,1] = 1

练习：

课时5：非线性回归、过度拟合、模型选择

图片的点看起来用二次回归合适，二次回归就属于非线性回归的一种

30维看起来就过拟合了

从上图看出，随着维度增加，在训练集上误差逐渐减少，而在测试集上误差先减小后增大。

降低模型过拟合常用方法之一：正则化

下面采用加入参数平方值作为正则化项

如何评价机器学习算法：

把所有数据按7:3分成训练集、测试集，再把训练集再按7:3分成训练集、验证集。

D

课时6：有监督学习分类

B

课时7：无监督学习

C

。

集成学习：

随机森林：用不同训练集的子集训练决策树，最后用不同决策树的训练结果求平均

boosting：加权使用不同模型。常用算法GDBT

猜你喜欢

转载自www.cnblogs.com/instant7/p/11575712.html

机器学习基础概念-阿里大学课程学习笔记

机器学习基本概念-阿里云大学

机器学习课程笔记

机器学习笔记（一）numpy的使用、机器学习基础概念

【机器学习课程-华盛顿大学】：1 案例研究 1.6 深度学习（1）概念描述

机器学习：基础概念

机器学习基础概念

机器学习---概念基础

机器学习的基础概念

机器学习--基础概念

机器学习课程学习笔记

机器学习概念笔记

【机器学习课程-华盛顿大学】：1 案例研究 1.3 分类（1）概念描述

【机器学习课程-华盛顿大学】：1 案例研究 1.5 推荐系统（1）概念描述

【机器学习课程-华盛顿大学】：1 案例研究 1.4 聚类（1）概念描述

Coursera华盛顿大学机器学习课程总结

机器学习与数据分析课程笔记-机器学习基本概念

机器学习基础学习笔记——基本概念

机器学习-基础概念学习笔记（一）

机器学习速成课程笔记

机器学习课程笔记一

机器学习课程笔记（一）

机器学习课程笔记（二）

机器学习入门课程（1）—— 相关概念

台湾大学林轩田机器学习基石课程学习笔记5 -- Training versus Testing

台湾大学林轩田机器学习基石课程学习笔记4 -- Feasibility of Learning

台湾大学林轩田机器学习基石课程学习笔记3 -- Types of Learning

台湾大学林轩田机器学习基石课程学习笔记2 -- Learning to Answer Yes/No

台湾大学林轩田机器学习基石课程学习笔记1 -- The Learning Problem

台湾大学林轩田机器学习基石课程学习笔记1--The Learning Problem

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

LogN级别的区间查询算法(线段树), 你学会了吗

数论概论(英文版.第4版)

idea 更新后和新的直接安装前，都需要配置 idea64.exe.vmoptions 后再使用

CANOpen系列教程04_CAN总线波特率、位时序、帧类型及格式说明

Java序列化基础

java排序算法整理

异常：org.apache.ibatis.reflection.ReflectionException

（算法练习）——二路归并排序

go 闭包函数

好程序员web前端技术分享媒体查询

每日归档

更多

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)