机器学习 day05（多元线性回归，向量化，及向量化高效的原理） - 代码天地

机器学习 day05（多元线性回归，向量化，及向量化高效的原理）

物联网 2023-06-18 19:27:54 阅读次数: 0

1. 单个特征（变量）的线性回归模型

房子的价格仅由房子的大小决定，如图：
可以用一条直线来拟合这些数据

2. 多个特征（变量）的线性回归模型

房子的价格由房子的大小，房子有多少个卧室，房子有几层，房子住了多少年共同决定，如图：
x下标j：第j列特征（变量）
n：特征（变量）的个数
向量x⁽ⁱ⁾：第i行的训练示例的所有特征（变量）
x⁽ⁱ⁾下标j：第i行的训练示例的第j列特征（变量）
该例子的线性回归模型如图：
多元线性回归的每一个特征X都有对应的W，多元是指具有多个X

3. 多元线性回归模型及成本函数

通过向量的点积来简化有n个特征（变量）的多元线性回归模型，如图：
由上图可知，单元和多元线性回归的成本函数分别为：
dot product：向量的点积，如图：
将向量a的每一个分量乘以向量b的对应分量，将所得之积相加，得出的标量，就是向量的点积结果。
multivariate regression：多元回归
这个模型是具有多个特征（变量）的线性回归，叫多元线性回归，不是多元回归

4. 向量化代码

向量化可以使代码更简洁，更容易编写，更容易阅读，运行也更高效。
向量化更高效的原因：NumPy（Python和机器学习中，最广泛的数值线性代数库）中的dot函数使用了并行硬件来提高效率，不论有没有GPU都行（GPU通常用于加速机器学习工作）
线性代数中，索引或计数是从1开始。代码的数组中，索引或计数是从0开始。
左下角的代码是顺序计算代码，效率很低，代码很长且重复
右上角的代码是for循环代码，效率很低，代码也不简洁。在Python中，range(0，n)表示，从0到n-1
右下角的代码是向量化代码，效率高，代码简洁

5. 向量化是怎么实现高效率的？
在这里插入图片描述

左边的for循环代码是不使用向量化的，计算机只会一步一步的执行，即在每一个时间戳上只会计算一次
右边的向量化代码，计算机第一步就会同时并行的将每对w和x相乘，第二步会获取这16个数据，并用专门的硬件非常高效的求和，并不需要一步一步把这16个数据加起来
这就表示，向量化的代码可以比没有向量化的代码，在更短的时间内进行计算。通常用于现代机器学习算法的大型数据集
例如，向量化在多元线性回归的梯度下降算法中的应用，向量d存放的是导数，0.1是学习率α，且忽略参数b：

在这里插入图片描述

左边的是不使用向量化的for循环代码
右边的是向量化代码，计算机在一个时间戳上执行一步操作：获取向量w中所有的值，并同时并行减去向量d中所有的值的0.1倍，最后将所有结果，在同一时间，并行的，一步回到向量w对应的位置上

猜你喜欢

转载自blog.csdn.net/u011453680/article/details/130222991

机器学习 day05（多元线性回归，向量化，及向量化高效的原理）

机器学习 day06（向量化应用于多元线性回归的梯度下降算法，正规方程）

机器学习-向量化

机器学习——简单线性回归之向量化（代码实现）　　机器学习——简单线性回归（原理推导+算法描述+代码实现）

吴恩达机器学习（二）线性回归 3/3 —— 向量化及正规方程

（机器学习的矩阵）（向量、矩阵与多元线性回归）

05-向量化logistic回归的梯度输出、广播机制、向量说明学习笔记

吴恩达-机器学习-向量化

机器学习——Day 3 多元线性回归

【机器学习·线性回归】标量、向量求导

吴恩达的机器学习编程作业7：lrCostFunction 向量化求解逻辑回归代价函数

吴恩达机器学习（三）逻辑回归 2/2 —— 模型向量化

机器学习-聚类(学习向量量化算法)

机器学习（十二）：学习向量量化算法（LVQ）

吴恩达深度学习：2.12向量化logistic回归

深度学习（二）向量化 Logistic 回归及其梯度输出

机器学习－－多元线性回归

机器学习多元线性回归

Python机器学习(4)——文本特征抽取与向量化

机器学习基础教程实践(一)——中文的向量化

机器学习基础教程实践(一)——中文的向量化

机器学习中向量化编程总结记录

深度学习之向量化

python学习随笔-向量化

【深度学习】再谈向量化

量化研究 | 机器学习算法——梯度下降法与线性回归

04-m个样本的梯度下降、向量化及计算举例、向量化逻辑回归学习笔记

线性回归之向量化

机器学习回归篇-多元线性回归

机器学习多元线性回归的数学原理推导

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)