结合lucene谈谈浮点数的压缩问题 - 代码天地

结合lucene谈谈浮点数的压缩问题

其他 2018-11-26 19:40:51 阅读次数: 0

先说说单精度float类型的压缩方法，lucene里面是将-1.0~125.0之间浮点数并且小数点部分为0的值使用1个字节压缩，当然必须排除-0.0f，其余的正数使用4个字节存储，负数使用5个字节存储（第一个字节是0xff）其余是原始的4个字节。

根据第一个字节就能对压缩的数值进行解析，-1~125的二进制形式为0b11111111~0b01111101,lucene将值加1并且将最高位置1,这样值就变成了0b10000000~0b11111110，考虑其余正数的最高位是符号位为0b00000000，其余负数的最高为是0b11111111,可以看出这三种情况是完全不冲突的，相信大家也能看出来为什么-1.0~125.0要排除-0.0f了吧,因为-0.0f的首字节是0b10000000跟前面(0b10000000~0b11111110)是冲突的。有兴趣的可以看看lucene的源码：

int intVal = (int) f;
final int floatBits = Float.floatToIntBits(f);

if (f == intVal
&& intVal >= -1
&& intVal <= 0x7D
&& floatBits != NEGATIVE_ZERO_FLOAT) {
// small integer value [-1..125]: single byte
out.writeByte((byte) (0x80 | (1 + intVal)));
} else if ((floatBits >>> 31) == 0) {
// other positive floats: 4 bytes
out.writeInt(floatBits);
} else {
// other negative float: 5 bytes
out.writeByte((byte) 0xFF);
out.writeInt(floatBits);
}

实际上双精度double类型的原理也是类似的，实现的时候跟float的方式稍有不同

猜你喜欢

转载自my.oschina.net/u/1268334/blog/2875194

结合lucene谈谈浮点数的压缩问题

结合lucene谈谈日期的压缩问题

浮点数的大数问题

浮点数精度问题

浮点数的精度问题

JS浮点数问题

浮点数与定点数问题

php 浮点数精度运算问题

golang浮点数精度问题

PHP浮点数精度损失问题

js浮点数精度问题

java浮点数运算精度问题

JS计算浮点数问题

php中浮点数计算问题

关于浮点数的死区问题

JavaScript 浮点数运算的精度问题

MATLAB浮点数精度问题

浮点数运算误差问题

python 浮点数的精度问题

Ucos printf 浮点数乱码问题

浮点数大小比较问题

【hive】关于浮点数比较的问题

浮点数不精确的问题

008_浮点数误差问题

关于【浮点数精度】的问题

浮点数除法中零的问题

浮点数向偶数舍入的问题

浮点数比较大小的问题

浮点数运算的精度问题

python 计算浮点数的精度问题

今日推荐

wlnmp 一键安装包更新 240522

ChatGPT 严重宕机，结果被造谣“遭遇俄罗斯黑客入侵”

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

周排行

010-题目：利用条件运算符的嵌套来完成此题：学习成绩>=90分的同学用A表示，60-89分之间的用B表示，60分以下的用C表示。

接口测试-工作心得记录八（使用locust库书写接口并发）

物理分页和逻辑分页

Hive建表语句详解--CREATE TABLE

爬虫学习----学习get和post请求

PDF生成类库

POJ 2139

前端路由基本原理

I/O多路转接之epoll

.NET开源项目 QuarkDoc 一款自带极简主义属性的文档管理系统

每日归档

更多

2024-05-23(9)

2024-05-22(41)

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)