机器学习算法基础一

其他 2020-02-22 16:47:16 阅读次数: 0

前文回顾：

最大似然估计

设总体分布为 $f(x, \theta)$ ，X₁ , X₂…X_n为该总体采样得到的样本。因为X₁ , X₂…X_n独立同分布，于是，它们的联合密度函数为：
$L(x_1, x_2, ····,x_n;\theta_1,\theta_2,···,\theta_k)=\prod\limits_{i=1}^{n}f(x_i;\theta_1,\theta_2,···,\theta_k)$
这里， $\theta$ 被看做固定但未知的参数；反过来，因为样本已经存在，可以看成 $X_1,X_2···X_n$ 是固定的， $L(x,\theta)$ 是关于 $\theta$ 的函数，即似然函数。
求参数 $\theta$ 的值，是的似然函数取最大值，这种方法就是最大似然估计。

最大似然估计的具体时间操作

求导求驻点

在实践中，由于求导数的需要，往往将似然函数取对数，得到对数似然函数；若对数似然函数可导，可通过求导的方式，解下列方程组，得到驻点，然后分析该驻点是极大值点 $\log L(\theta_1,\theta_2,···\theta_k)=\sum\limits_{i=1}^{n}logf(x_i;\theta_1,\theta_2,···,\theta_k)$ $\frac{\partial L(\theta)}{\partial\theta}=0, i=1,2,···k$
$P最大的时候\theta的取值$

最大似然估计例子

10次抛硬币的结果是：正正反正正正反反正正
假设p是每次抛硬币结果为正的概率。则： $P = pp(1-p)ppp(1-p)(1-p)pp$
$= p^7(1-p)^3$
最优解（使函数取最大值）是：p=0.7

二项分布的最大似然估计

投硬币实验中，进行N次独立实验，n次朝上，N-n次朝下。
假定朝上的概率为p，使用对数似然函数作为目标函数： $f(n|p) = \log(p^n(1-p)^{N-n})\longrightarrow h(p)$
$\frac{\partial h(p)}{\partial p}=\frac{n}{p}-\frac{N-n}{1-p}\longrightarrow 0 \Rightarrow p=\frac{n}{N}$

正态分布的最大似然估计

若给定一组样本 $X_1,X_2...X_n$ ，一直它们来自于高斯分布 $N(\mu,\sigma)$ ，试估计参数 $\mu,\sigma$ 。

按照MLE的过程分析

高斯分布的概率密度函数：
将 $X_i$ 的样本值 $x_i$ 带入，得到：

化简对数似然函数

在这里插入图片描述

参数估计的结论

目标函数
将目标函数对参数 $\mu,\sigma$ 分别求偏导，容易得到：

符合直观想象

上述结论和矩估计的结果是一致的，并且意义非常直观：样本的均值即高斯分布的期望，样本的伪方差即高斯分布的方差。
- 注：经典意义下的方差分布是n-1；在似然估计的方法中，求的方差是n
该结论将在期望最大化EM算法、高斯混合模型GMM中将继续使用。

数据清洗

赔率

在这里插入图片描述

特征选择——降维
从N个特征中选择n个，并不是把所有特征放进去结果会更好。

分类
用线性分类器：线性分类也可以经过不同特征相乘形成非线性的分类器而只使用线性参数。注意在过高阶数下可能会出现过拟合。

不可描述的两脚兽

发布了45 篇原创文章 · 获赞 2 · 访问量 1万+

私信关注

猜你喜欢

转载自blog.csdn.net/qq_22096121/article/details/104110494

机器学习算法基础一

机器学习算法(一) 机器学习基础知识

机器学习算法一

机器学习（一）——机器学习基础

【机器学习】（一）机器学习基础

机器学习算法系列（一）-基础机器学习算法入门

机器学习算法基础--绪论一（教材为西瓜书）

Python机器学习基础（一）K-近邻算法

机器学习算法基础——一元线性回归

算法基础学习（一）

机器学习算法模型（一）

机器学习----KNN算法（一）

机器学习(一)------KNN算法

机器学习算法进阶一

机器学习算法（一）SVD

机器学习——优化算法（一）

【机器学习算法】一、KNN

机器学习基础笔记一

机器学习基础概念（一）

机器学习的数学基础一

机器学习--算法基础

【机器学习】数据科学基础——机器学习基础实践（一）

深度学习（机器学习）算法面试(一)

机器学习（一）---KNN算法学习

机器学习基础学习笔记【一】

机器学习算法（一）：线性回归算法

机器学习算法——集成算法（一）

机器学习算法——回归算法总结（一）

机器学习算法（一） | Adaboost算法详解

机器学习（一）常见的机器学习算法

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)