英文字母信息熵与冗余度计算Python实现 - 代码天地

英文字母信息熵与冗余度计算Python实现

其他 2018-06-04 05:12:57 阅读次数: 0

26个英文字母在平均出现时的信息熵是4.7BIT,而去掉冗余度后的英文字母的信息熵是4.03BIT。

公式: H(信息熵) = -∑ Pi log2(Pi); Pi:为每个字母在信息中出现的概率; 计算公式并不复杂. 取以2为底的对数的道理也很简单,因为如果: 2n = X 的话,那么logX = n; 所以可以看出所谓信息熵就二进制的字符集在去掉冗余度后的二进制编码位数.冗余度是通过统计每个字符出现概率获得的。

各个字母英语中出现的频率

字母	英语中出现的频率
a	8.167%
b	1.492%
c	2.782%
d	4.253%
e	12.702%
f	2.228%
g	2.015%
h	6.094%
i	6.966%
j	0.153%
k	0.772%
l	4.025%
m	2.406%
n	6.749%
o	7.507%
p	1.929%
q	0.095%
r	5.987%
s	6.327%
t	9.056%
u	2.758%
v	0.978%
w	2.360%
x	0.150%
y	1.974%
z	0.074%

python代码实现:

import math

def calEntropy(string):
    h = 0.0
    sumt = 0
    letter = [0] * 26
    string = string.lower()
    for i in range(len(string)):
        if string[i].isalpha():
            letter[ord(string[i]) - ord('a')] += 1
            sumt += 1
    print('\n', letter)
    for i in range(26):
        p = 1.0 * letter[i] / sumt
        if p > 0:
            h += -(p * math.log(p, 2))

    return h


test = input("输入一个英文句子：")
print('\n熵为：', calEntropy(test))

'''
letter = [8167,1492,2782,4253,12702,2228,2015,6094,6966,153,772,4025,2406,6749,7507,1929,95,5987,6327,9056,2758,978,2360,150,1974,74]
h = 0
for i in range(26):
    h += -(letter[i]/sum(letter)*math.log(letter[i]/sum(letter),2))
print(h)
'''

结果请访问：点击打开链接

猜你喜欢

转载自blog.csdn.net/xyisv/article/details/80273679

英文字母信息熵与冗余度计算Python实现

python遍历小写英文字母

[Python] 编码生成26个英文字母

Python - 随机生成英文字母

python中实现26个英文字母与其对应的ascii码之间的转换

python实现26个英文字母按规则输出

用python实现英文字母和相应序数转换

统计英文字母

输出英文字母

英文字母的排序

英文字母发音

输出大写英文字母

输出英文字母ch在英文字母表中的位置

Python实现统计字符串的英文字母、空格、数字和其它字符的个数

Java中英文字母汉字混合字符长度值计算

【python常用小工具】python打印26个英文字母

css text-transform 实现英文字母或拼音大小写转换

C语言实现字符串英文字母大小写的转换

强大的CSS：3种姿势实现26个英文字母的案例

CSS：3种姿势实现26个英文字母的案例

[图像识别]pytorch实现手写英文字母识别：

从英文字母中找出最长的单词

excel 英文字母大小写转换

C# string 保留数字英文字母

前端名称命名--英文字母

随机生成英文字母，并且统计频数

英文字母和汉字的字节长度问题

设计统计英文字母出现频率的感想

26 打印26个英文字母

Golang生成26个英文字母案例

今日推荐

手把手教你用 LangChain 实现大模型 Agent

外星人入侵（python）

超全的免费chatGPT列表【建议收藏】

52.2k star! 自己部署gpt4free, 免费使用各种GPT

2024年（第十届）全国大学生统计建模大赛优秀论文解析——中国经济发展与碳排放库兹涅茨曲线的验证研究

【自动驾驶技术】自动驾驶汽车AI芯片汇总——NVIDIA篇

7个免费的ChatGPT网站，给大家送上

Angular v18 正式发布！

【VMware】 vCenter Converter standalone 6.6.0正式版下载

开源日报 | Angular v18；大模型价格战下的推理优化；Mistral AI以开源模型瞄准美国市场；硅谷有自己的鲁迅

数学建模Matlab之数据预处理方法

充电桩---ISO15118协议详细介绍

周排行

keepalived实现LB配置

数据库相关中间件收录集

Spring Boot 入门之 Web 篇（二） Spring Boot 入门之 Web 篇（二）

gitee 搭建个人网站

Java校招基础知识总结（横扫BAT,就业经验交流会演讲稿）

工程管理器

Delphi定位TDataSet数据集最后一条记录

cocos2dx笔记1:概述

Java实现 LeetCode 110 平衡二叉树

MacBook IDEA激活码

每日归档

更多

2024-05-30(4)

2024-05-29(65)

2024-05-28(2)

2024-05-27(56)

2024-05-26(6)

2024-05-25(68)

2024-05-24(65)

2024-05-23(9)

2024-05-22(41)

2024-05-21(8)