熵为什么使用log？ - 代码天地

熵为什么使用log？

企业开发 2022-05-12 21:41:19 阅读次数: 0

首先，信息也是物理量，就像质量kg，我们测量质量的方法是，我们选择一个参照物，把这个物体的质量定义为1kg，当想要测量其它物体的质量时就看这个这个物体的质量相当于多少个参照物的质量，这里的多少个便是kg。

上图中待测物体的质量m等于参照物体的质量B乘以参照物体的个数n，所以当知道总质量m要求个数n时，我们用乘法的反函数，既除法来计算。

但是测量信息时，不能用除法，比如抛掷3枚硬币能够产生的结果是2的3次方=8种，而不是2*3=6种，是指数关系而不是线性关系，所以当知道可能情况的个数m，想求这些情况相当于多少个（n）参照事件所产生的时，用指数运算的反函数，即对数函数来计算，如下图。

如果换成选择题，四个选项，选c的概率是1/2，其余三个选项概率相通都是1/6,熵如何计算呢？需要分别测量待测试件的每种可能情况的信息量后，乘以他们各自的发生概率再相加即可。

首先需要计算概率为1/6的情况的不确定性相当于投掷多少次硬币所产生的的不确定性m，我们知道1%会发生的情况，相当于从100个等概率情况中确定实际情况，概率的倒数等于概率情况的格式，m=1/p，用1/p替换等概率情况个数m后，我们就可以计算每种情况的信息量了，如下图。

最后，-logp 就是一种可能性的信息量，一个事件总的信息量就是每一种可能的情况的信息量乘以它们发生的概率，其实就是信息量的数学期望。

扫描二维码关注公众号，回复： 14136225 查看本文章

至于log的底，我理解他就是一个参考量，机器学习中常用e作为底，有时确实方便计算。

猜你喜欢

转载自blog.csdn.net/xian0710830114/article/details/121702718

熵为什么使用log？

信息熵为什么要定义成-Σp*log(p)？

softmax交叉熵为什么要取-log

为什么使用交叉熵呢？

为什么条件熵使用联合概率加权

通俗讲清楚为什么使用信息熵增益比而不是信息熵增益？

为什么用log4j，如何使用

为什么LR模型损失函数使用交叉熵不用均方差？

为什么在分类问题中使用交叉熵loss函数

log4j - 什么是log4j?为什么要使用log4j?

交叉熵为什么能作为损失函数？

为什么要用交叉熵作为代价函数

为什么交叉熵可以用于计算代价函数

为什么建议使用sl4j，不建议使用log4j

什么是熵？

Log日志框架的学习三.为什么要使用SLF4J而不是Log4J

为什么要用log4j？

MySQL 为什么需要 redo log？

为什么要使用SLF4J而不是Log4J [转]

为什么使用 SLF4J 而不是 Log4J 来做 Java 日志

为什么禁止直接使用日志系统(Log4j、Logback)中的 API

为什么要使用SLF4J而不是Log4J

VMD为什么需要进行参数优化，最小包络熵，样本熵，排列熵，信息熵，适应度函数到底该选哪个

简述为什么输出层在使用sigmoid做激励函数时, 代价函数用交叉熵比平方差更好

为什么使用 Telegram

为什么使用GitHub

为什么使用NOSql

为什么使用redis

为什么使用Maven？

为什么使用promise

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)