NLP(17): 交叉验证，MAP vs MLE

其他 2021-02-28 16:10:18 阅读次数: 0

1、NLP应用场景

Affective computing

图像
文本
语音

2、情绪识别实战

1、读取csv文件
2、划分标签和特征
3、训练数据和测试数据分割
4、对x_train, y_train做tf-idf
5、使用逻辑回归和网格搜索，超参数调参——使用GridSearchCV
6、混淆矩阵——confusion_matrix

3、Cross validation

在训练集上，再划分验证集，使用验证集去对模型中的超参数进行调参，对于使用L2正则的logistics 回归， $\lambda$ 为超参数。在训练集和验证集上进行k-folds 交叉验证，找到最好的超参数c。然后再对测试集进行测试。

lambda 越大时，正则起到的作用越大，它的参数w就会越来愈小
lambda越小时，正则起到的作用越小，参数w就会越来越大。

在这里插入图片描述

在这里插入图片描述

使用交叉验证选择超参数的步骤：

将train_data 划分为k份，每一份都会有一次称为validation set的机会
把每一个超参数带入k份数据，求出在该训练集验证集和该超参数情况下的准确率，做平均。
把备选的每个超参数都带入，求k种情况下的平均准确率
最后取最大准确率下的超参数为最优超参数

4、正则

加入正则后，求得到的参数带入原损失函数会让损失函数变大，可以理解为，损失函数越小，拟合程度越大，正则为了减少过拟合，对模型的训练变得不那么严格了，所以会让损失变大。

5、MLE vs MAP 介绍

MLE:优化给定参属下，最大化看到样本的概率
MAP:优化：后验概率，先验概率+MLE

对于贝叶斯学派，先验概率为正则。
先验概率可以给定参数服从某个分布：

高斯分布
laplace 分布

后验概率通过观测数据会影响到先验概率

随着观测样本数量的增加，先验概率的重要性会降低
可以理解为当值有一个样本时，后验概率只依靠观测样本的极大似然估计是不足以很好的表达整个数据分布的特性的，这时候引入先验概率可以修正后验概率。当样本数量越累越多，极大似然估计对于后验概率会有很强大的代表性，此时先验概率就没那么重要了。

猜你喜欢

转载自blog.csdn.net/weixin_51182518/article/details/113793242

NLP(17): 交叉验证，MAP vs MLE

MLE vs MAP: the connection between Maximum Likelihood and Maximum A Posteriori Estimation

MLE和MAP的小结

MLE MAP EM

Naive Bayes MLE MAP

MLE

MLE-MAP-Bayes模型

MLE MAP 贝叶斯

MLE、MAP、贝叶斯

学习笔记17：最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式

Bayesian（MAP）与Maximum Likelihood（MLE）的区别

MLE，MAP和贝叶斯推断

【机器学习入门】交叉熵损失函数与MLE准则

最大似然估计（MLE）最大后验概率（MAP）

最大似然估计【MLE】与最大后验概率【MAP】

【Mark Schmidt课件】机器学习与数据挖掘——MLE与MAP

CSE 6363 - Machine Learning Homework MLE, MAP, and Basic Supervised Learning

机器学习中的MLE、MAP、贝叶斯估计

机器学习中的MLE、MAP和贝叶斯估计

极大似然估计（MLE）与极大后验估计（MAP）

最大后验估计MAP/最大似然估计MLE

bayes and mle

NLP VS NLU

频率学派还是贝叶斯学派？聊一聊机器学习中的MLE和MAP

最大似然估计（MLE）与最大后验概率（MAP）在机器学习中的应用

ML15理解MLE-MAP-贝叶斯公式

最大似然估计最大似然估计（MLE）最大后验概率（MAP）

【模式识别与机器学习】——最大似然估计（MLE）最大后验概率（MAP）

最大似然概率（MLE）和最大后验概率（MAP）

机器学习面试必知：MLE最大似然估计与MAP最大后验概率

今日推荐

数学建模Matlab之数据预处理方法

充电桩---ISO15118协议详细介绍

对话Kaldi之父、小米首席语音科学家Daniel Povey：开源环境比金钱和荣誉更吸引我 | AGI技术50人...

Hugging Face全攻略：轻松下载Llama 3模型，探索NLP的无限可能！【实操】

阅读送书抽奖？玩转抽奖游戏，js-tool-big-box工具库新上抽奖功能

百度发布Comate代码知识增强2.0，国内首个支持实时检索智能代码助手

黑客利用扫雷游戏 Python 克隆隐藏恶意脚本，攻击欧洲和美国金融机构

微软对开源字体 Cascadia Code 进行重大更新

好书推荐《ChatGPT原理与架构：大模型的预训练、迁移和中间件编程》

Baidu Comate 智能编码助手：编程新伙伴，效率新飞跃

AI时代：人工智能大模型引领科技创造新时代

百篇博客 · 千里之行

周排行

Python模块之shelve

勇于承担责任

Hikyuu 1.1.0 发布，量化交易研究框架

字节跳动Java3面“凉凉”~不负韶华，努力复习备战“金三银四”

Linux下静态链接库与动态链接库的区别

spring boot架构改造

怎么理解AOP

文件不同步 --本地和eclipse

在linux配置nginx负载均衡

Linux Shell基础命令

每日归档

更多

2024-05-28(2)

2024-05-27(56)

2024-05-26(6)

2024-05-25(68)

2024-05-24(65)

2024-05-23(9)

2024-05-22(41)

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)