剖析金额不能用浮点数表示的原因

近期参与到了一个金融项目，开发十分的谨慎。先抛出我有问题的代码，作用是把以分为单位的金额转成以元为单位的字符串。

long adjustFee;
String.valueOf(adjustFee / 100.0);

很自信的以为这行代码简洁明了的完成了使命。同事review了我的代码后，指出这段代码会造成精度丢失的问题。先演示一个demo，构造一个浮点数丢失精度的场景。

    @Test
    public void addTest() {
        long   l     = Long.MAX_VALUE;
        double d     = l / 1.0;
        double clone = d;

        System.out.println(d);
        for (int i = 0; i < 1000000000; i++) {
            clone += 1;
        }
        System.out.println(clone);
        System.out.println(clone == d);
    }

程序输出结果

9.223372036854776E18
9.223372036854776E18
true

输出结果足以颠覆三观。一个双精度浮点数，加了10亿之后，居然没有发生任何变化！如果在金融项目里发生这种事，何止是直接被fire掉，蹲监狱都是可能的。这类问题其根本原因在于浮点数在计算机内部的表示方法。这种IEEE标准表示法兼顾了数据的精度和大小。

图片摘自网上。学过《计算机组成原理》的同学都知道，32位的浮点数由3部分组成：1比特的符号位，8比特的阶码（exponent,指数），23比特的尾数（Mantissa，尾数）。这个结构会表示成一个小数点左边为1，以底数为2的科学计数法表示的二进制小数。浮点数的能表示的数据大小范围由阶码决定，但是能够表示的精度完全取决于尾数的长度。long的最大值是2的64次方减1，需要63个二进制位表示，即便是double，52位的尾数也无法完整的表示long的最大值。不能表示的部分也就只能被舍去了。对于金额，舍去不能表示的部分，损失也就产生了。
了解了浮点数表示机制后，丢失精度的现象也就不难理解了。但是，这只是浮点数不能表示金额的原因之一。还有一个深刻的原因与 进制转换有关。十进制的0.1在二进制下将是一个无线循环小数。同样，给出一个能体现这个问题的demo。

public class MyTest {  
    public static void main(String[] args) {  
        float increment = 0.1f;  
        float expected = 1;  
        float sum = 0;  
        for (int i = 0; i < 10; i++) {  
            sum += increment;  
            System.out.println(sum);  
        }  

        if (expected == sum) {  
            System.out.println("equal");  
        } else {  
            System.out.println("not equal ");  
        }  
    }  
}

程序输出结果：

10个浮点数0.1相加最后并没有得到1。如果一个小数不是2的负整数次幂，用浮点数表示必然产生浮点误差。做一次延伸，A进制下的有限小数，B进制下极有可能是无限小数。这种情形下，十进制小数转换成尾数长度固定的浮点数，误差也将产生。
综上，浮点数不精确的根本原因在于尾数部分的位数是固定的，一旦需要表示的数字的精度高于浮点数的精度，那么必然产生误差！这在处理金融数据的情况下是绝对不允许存在的。
对于金融项目，误差是不能容忍的。那么用什么数据类型才能精确的表示金额？JDK提供了一个BigDecimal的类，这个类可以表示任意精度的数字。有ACM经验的同学对这个类的底层实现应该不陌生，用int数组模拟大数。各大OJ平台都有长整数加减乘除的题目，八大基本数据类型都无法解决这类题目，唯一可行的解就是用数组模拟长整数。
不仅金融项目对浮点误差是零容忍的，国防军工航天项目亦是如此！1991的海湾战争，沙特的爱国者导弹因为浮点误差产生了0.3秒的误差，不仅没能拦截伊拉克的飞毛腿导弹，而且因为0.3秒的时间误差，导致了700余米的位移误差，炸毁了美军自己的军营，28名美国大兵出师未捷身先死，更讽刺的是死于浮点误差而非枪林弹雨（详见《CSAPP》修订版第二章习题32）。
回头再看自己犯的错误，不禁一身冷汗，这种代码要是上到正式环境了，恐怕会为公司带来不少的损失！优秀的程序员不会栽在同一个陷阱，把这个经验记下来，分享给大家。
能够快速的理解这个问题，也得益于本科时学习了当时认为对编程根本没卵用的《计算机组成原理》。修过的课程和阅读过的书，都在潜移默化的帮助你我写出鲁棒性更好的代码。

剖析金额不能用浮点数表示的原因

猜你喜欢