机器学习-基本数学概念

导数和偏导数

解析:导数是指对X一个自变量求倒,偏导数是有两个或多个变量求倒

导数:z=f(x,y)点(x0,y0)是其定义域D内一点.把y固定在y0而让x在x0有增量△x

偏导数:△z=f(x0+△x,y0)-f(x0,y0),如果△z与△x之比当△x→0时的极限存在,那么此极限值称为函数z=f(x,y)在(x0,y0)处对x的偏导数.

说明:几何意义上的理导数只是在二维平面上一条曲线上某点的斜率.偏导数是在三维空间内有一张曲面f,垂直于Y轴切曲面一刀可以得到刀具与曲面间的一条曲线,对这条曲线某一点求斜率就是传说中的 偏f/偏x;同理垂直于x轴切曲面一刀可以得到刀具与曲面间的另一条曲线,对这条曲线某一点求斜率就是传说中的 偏f/偏y.总之,都可以看做求斜率,只不过一个二维一个三维.


奇异矩阵和满秩矩阵

由定义直接可得n阶可逆矩阵的秩为n,通常又将可逆矩阵称为满秩矩阵, det(A)≠0;不满秩矩阵就是奇异矩阵,det(A)=0。


矩阵的秩

如果一个矩阵Am×n存在k阶子式不为0,且任意k+1阶子式全为0,称这个矩阵的秩是k,r(A)=k。


高斯分布

  • 正态分布(Normal distribution),也称“常态分布”,又名高斯分布(Gaussian distribution),最早由A.棣莫弗在求二项分布的渐近公式中得到,高斯分布函数代表的是概率分布函数
  •  测量误差(测量)服从高斯分布的情况下, 最小二乘法等价于极大似然估计
  • 正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线
  • 随机变量X服从一个数学期望为μ、方差为σ^2的正态分布,记为N(μ,σ^2)。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。当μ = 0,σ = 1时的正态分布是标准正态分布
  • 一维正太分布公式:
  • 标准正太分布公式:  ,其中x为误差项,相当于,x不是曲线函数中的自变量,而
  • 正态分布图形特征:
  1. 集中性正态曲线的高峰位于正中央,即均数所在的位置。
  2. 对称性:正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交。
  3. 均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。
  • 参数的含义:
  1. 正态分布有两个参数,即期望(均数)μ和标准差σ,σ2为方差。
  2. 正态分布具有两个参数μ和σ^2的连续型随机变量的分布,第一参数μ是服从正态分布的随机变量的均值,第二个参数σ^2是此随机变量的方差,所以正态分布记作N(μ,σ2)。
  3. μ是正态分布的位置参数,描述正态分布的集中趋势位置。概率规律为取与μ邻近的值的概率大,而取离μ越远的值的概率越小。正态分布以X=μ为对称轴,左右完全对称。正态分布的期望、均数中位数、众数相同,均等于μ。

对数公式

  • 对数公式是数学中的一种常见公式,如果a^x=N(a>0,且a≠1),则x叫做以a为底N的对数,记做x=log(a)(N),其中a要写于log右下。其中a叫做对数的底,N叫做真数。通常我们将以10为底的对数叫做常用对数,以e为底的对数称为自然对数。
  • 基本性质:
  1.  
  2.  
  3.   
  4.   
  5. 负数与零无对数.
  6.   * =1
  7.  
  8.  
  9.  
  10.  
  11.  

最大似然估计

  • 是根据已有的大量样本(实际上就是利用已知的条件)来推断事件本身的一些属性参数的方法,最大估计更是最能反映这些出现的样本的,所以这个参数值也是最可靠和让人信任的,得到这个参数值后,等来了一个新样本 X(i+1) 后,我们可以预测它的标签值
  • 最大似然函数应用:https://mp.weixin.qq.com/s/Wb7rXEBK_UVV1hgJBjzaEA
  • 公式:

极小值

  • 在某一坐标点,斜率为0的点,也就是斜率与x轴平行
  • 求自变量的偏导数,可以求得函数的极小值
  • 在偏导为零的这个点,函数对求偏导的自变量的变化率是零,也就是说在认为其他自变量为常量的情况下,函数在这一点的变化是零

梯度下降

  • 梯度下降的方向就是在该点处使值变小最快的方向
  • 梯度是函数在某点处的一个方向,并且沿着该方向变化最快,变化率最大
  • 用数学方法直接求解最小二乘项的权重参数然而有时参数是无法直接求解的,此时我们就得借助梯度下降法,不断迭代直到收敛得到最终的权重参数

猜你喜欢

转载自blog.csdn.net/u012089823/article/details/81668900