浮点型表示方法

今天在牛客刷题时，遇到了一题浮点型表示类型的题目，因为之前没接触，故记录下来。

N=M × R^E

比如： $12.345 = 1.2345 \times 10^{1}$

$12.345 = 1.2345 \times 10^{1}$

因此，在已知标准下，要表示浮点数，

一是要给出尾数M的值，通常用定点小数形式表示，它决定了浮点数的表示精度，即可以给出的有效数字的位数。

二是要给出阶码，通常用定点整数形式表示，它指出的是小数点在数据中的位置，决定了浮点数的表示范围。因此，在计算机中,浮点数通常被表示成如下格式:（假定为32位浮点数，基为2，其中最高位为符号位）

按照上面的指数表示方法，一个浮点数会有不同的表示：

$0.3 \times 10^{0}$

为了提高数据的表示精度同时保证数据表示的唯一性，需要对浮点数做规格化处理。

在计算机内，对非0值的浮点数，要求尾数的绝对值必须大于基数的倒数，即 $| M | \geq \frac{1}{R}$

$| M | \geq \frac{1}{R}$

比如，二进制原码的规格化数的表现形式：(0正1负)

正数 0.1xxxxxx

负数 1.1xxxxxx

注意，尾数的最高位始终是1，因此我们完全可以省略掉该位。比如(−1)(1)×(1+0.1110 0000 0000 0000 0000 000)×2128−127 中这个1在二进制中表示就会被省略。

至此，我们引入IEEE754 标准，该标准约束了浮点数的大部分使用设置：(尾数用原码；阶码用“移码”；基为2)

1:尾数用原码,且隐藏尾数最高位。

原码非0值浮点数的尾数数值最高位必定为 1，因此可以忽略掉该位,这样用同样多的位数就能多存一位二进制数，有利于提高数据表示精度，称这种处理方案使用了隐藏位技术。当然，在取回这样的浮点数到运算器执行运算时，必须先恢复该隐藏位。

2：阶码使用“移码”，基固定为2

$12.345 = 1.2345 \times 10^{1}$

于是，

一个规格化的32位浮点数ｘ的真值为：

$x = (- 1)^{s} \times (1. M) \times 2^{E - 127}$

一个规格化的64位浮点数ｘ的真值为：

$x = (- 1)^{s} \times (1. M) \times 2^{E - 1023}$

下面举一个32位单精度浮点数-3.75表示的例子帮助理解：

(1) 首先转化为2进制表示

$- 3.75 = - (2 + 1 + 1 / 2 + 1 / 4) = - 1.111 \times 2^{1}$

(2) 整理符号位并进行规格化表示

$- 1.111 \times 2^{1} = (- 1)^{(1)} \times (1 + 0.1110 0000 0000 0000 0000 000) \times 2^{1}$

(3) 进行阶码的移码处理
$(- 1)^{(1)} \times (1 + 0.1110 0000 0000 0000 0000 000) \times 2^{1}$

于是，符号位S=1，尾数M为 $1110 0000 0000 0000 0000 000$

$1 1110 0000 0000 0000 0000 000 1000 0000$

转载自：https://blog.csdn.net/shuzfan/article/details/53814424