数据和文字的表示方法

一，数据的表示
在计算机中，数据（数值)有2种表达方式：
1，以字符串，图形等方式表达数据。使用这种方式表达的数据无法进行数值计算。
2，用机器码将数据存储在计算机中。以这种形式表达的数据可以进行加减乘除运算。
3，十进制数串可以用 BCD码直接表示。
在BCD码中，每个十进制数位占 4bits，也就是说，1B 可以表达 2个十进制数值。在BCD码中，12©表示正号，13(D)表示负号。符号位放在数值位之后。此外，BCD码规定，数位 + 符号位应为偶数，如果为奇数，需在最高位补0。
BCD码可分为有权码和无权码 2种：
1）有权码：如：8421码，2421码，5211码。

以 8421码为例： 2³ , 2² , 2¹ , 2⁰：
1011 代表： 8+2+1 = 11

2）无权码：余3码；格雷码；

余3码：在 8421码的基础上加 0011；

数据表示方法:
**1，真值表示：**将十进制数值转换为二进制形式，如：
(10)₁₀ ：(1010)₂ ;
(-10)₁₀: (-1010)₂;
2，机器码表示:

原码：分为数值位和符号位，其中，最高位为符号位，0 代表正，1 代表负。
（10）₁₀ ：01010 ;
(-10)₁₀ : 11010；
其中最高位为符号位，0正1负；
补码：分为数值位和符号位，其中，最高位为符号位，0 代表正，1 代表负。
equation1：补码 = 反码 + 1；
equation2：x代表真值；
正数 x 补码 = 正数反码 = 正数原码；
负数 x 补码 = 2ⁿ⁺¹ + x = 2ⁿ⁺¹ - |x|；

补码的最大优点就是将减法运算转换为了加法运算。

补码采用了模/mod 的概念，将减法运算转为了加法运算；
如：以时钟为例，其模为12，要将 14:00 调至 9:00，有2种方法：
14 + 7 = 21 （21 - 12 = 9）；
14 - 5 = 9；
在第二种方法中，利用模的转换，可将减法转为加法：14 - 5 = 14 + 12 - 5 = 14 + 7

反码：分为数值位和符号位，其中，最高位为符号位，0 代表正，1 代表负。
正数的原码，反码，补码相同；
负数的反码为：原码符号位不变，数值位取反；
反码主要用途：求解补码；
移码：移码只有数值位，没有符号位，主要用于浮点数的表示中。
在浮点数的规格化表示中，移码主要用于阶码的表示: E = e + 127 (32bits 单精度）；E = e + 1023(64bits 双精度）；
使用移码，可以使得指数的比较变得简单明了（使用移码后，阶码全部变为了正整数，便于比较大小）；
equation1：移码 = 补码数值位不变，符号位取反；
equation2：移码 = 2ⁿ + x；n为数值有效位；x为真值；

3，浮点数规格化表示
浮点数的规格化表示规定：当浮点数的尾数部分不为0时，将尾数最高位设为1.M。
在 IEEE754 标准中，其具体表达方式为：
32单精度表示： x = (-1)^s 1.M 2^E-127 ； e = E - 127; 符号位占 1位；指数位/阶码占 8位；尾数位占 23位；
64双精度表示： x = (-1)^s 1.M 2^E-1023; e = E - 1023; 符号位占 1位；指数位/阶码占 11位；尾数位占 52位；

上述几种数据表示形式的转换方法总结：
正数：原码 = 补码 = 反码；
负数：原码数值位取反 -> 反码；
反码 + 1 = 补码；
移码 = 补码数值位不变，符号位取反；

二，文字的表示:
1，字符及字母表示方法：ASCII
ASCII 用于表达字母/字符以及其他一些操控符，其编码方式规定：一个字母/符号用 8bits来表示，其中，最高位为偶校验位，其余7位（共 128 种形式）用于表达字符/字母。
2，字符串存储方式：
一个字符串由一系列字母组成，而每一个字母可用一个ASCII用于存储，换言之，字符串可通过存储一系列的ASCII进行存储。
字符串的存储方式有：1）小端存储（字符串低位存于地址低位，字符串高位存于地址高位）；2）大端存储（字符串低位存于地址高位，字符串高位存于地址低位）。
如：if a > b , then read©；
将高位字符i 存于地址高位，低位字符) 存于地址低位。这种存储方式即为小端存储。
2，汉字的表示方法：
区位码：将汉字分为 94个区，每个区分为94位。其实质上是将汉字存储在一个二维数组中，表达一个汉字需要分别 input 区码和位码，共4bits。如“中”，其区位码为：5448，54为区码，48为位码；
国标码：将区位码的 ”区码和位码“ 分别加上 16进制的 20H。
汉字内码：将国标码的 “区码和位码” 分别加上 16进制的 80H，这样其最高位就变为了1，从而有效防止了撞址 ASCII（区码和位码各占 8bits，由于ASCII的最高位为0，汉字内码的设定将其区码和位码的最高位均变为了1，防止其编码与 ASCII编码混肴）。

三，校验码
在 info 传递过程中，由于元件故障，噪声干扰的缘故，常会发生 info部分丢失的现象，为了确保 info 传递无误，引入校验码来供接收人员检测 info 是否传递无误。
校验码：将信息位和校验位拼接在一起，便形成了校验码。

下面介绍3种校验码：

1，奇数校验：
奇数校验码中，有1位校验位，其跟随在信息位之后。
假设现有奇数校验码：x1,x2,x3,…,xk,C;
则校验位 C = 信息位各位进行异或运算后，取反：
C = ~(x1 xor x2 xor … xor xk)。
接收到的奇数校验码，如果其校验位 C = 信息位各位进行异或运算后，取反，则说明info 传递无误。即：If C xor x1 xor x2 xor … xk = 1 , info传递无误。

2，偶数校验
偶数校验码中，有1位校验位，且其跟随在信息位之后。
假设现有偶数校验码：x1,x2,x3,…,xk,C;
则校验位 C = 信息位各位进行异或运算:
C = x1 xor x2 xor … xor xk
在接收到偶数校验码后，如果其校验位 C = 信息位各位进行异或运算，则说明 info 传递无误。即： If C xor x1 xor x2 xor … xk = 0, info 传递无误。

无论是奇数校验还是偶数校验，其只能检测出 info 中是否有错误信息，但是无法准确定位错误的出处。

异或运算：a xor b，如果 a != b，则 a xor b = 1, 否则，a xor b = 0;

3，海明码
较奇/偶校验更优，海明码不仅能检测 info 是否有误，还能准确定位错误来源。
1，r个校验位可表达的信息位个数
具有r个校验位的海明码，其校验位表达形式共有 2^r 种。其中，除去一种正确的表达形式，以及 r个可能错误（r个校验位均可能发生错误），r个校验位最大可以表示的信息位k 为：2^r - 1 - r，即：k <= 2^r - 1 - r。
2，海明码中信息位和校验位的放置规则：
海明码H 中，信息位和校验位是穿插放置的，其信息位和校验位的归置原则如下：
**校验位P：**第i个校验位Pi 在海明码中的存放位置为：2^i-1。
即：P1 存放在 H1；
P2 存放在 H2；
P3 存放在 H4；
**信息位D：**信息位按从小到大的形式依次摆放在海明码中，如：D4D3D2D1 依次摆放在 H4H3H2H1 中。
此外，对于信息位D来说，与其相关的校验位的寻找规则如下：
被校验位在海明码H 中的位号 = 其校验位在海明码H 中的位号之和。
根据此公式，我们可以推出每个信息位Di 所对应的校验位。
3，海明码中，每个校验位 Pi = 其所校验的信息位Di 进行异或运算。
即，对于校验位及其对应的信息位，应该存在如下等式： Pi xor Di = 0，当且等当等式成立时，info传递无误。

4，举例说明：海明码
1）3个校验位可以表达几个信息位？
2）将信息位和校验位正确摆放在海明码H 中？
3）给出海明码检测错误的方式以及定位错误的方式？
**1）**根据公式 2^r - 1 - r >= k，可知 k = 4，即 3个校验位的海明码可以存放 4个信息位。

**2）**对于校验位Pi，其在海明码H 中的存放位号为：2^i-1，所以：
P1 -> H1;
P2 -> H2;
P3 -> H4;
H中的其他位号用于存储信息位，对于信息位 D4D3D2D1 = 1010，其在H中的存放位置如下：
H7 H6 H5 H4 H3 H2 H1
D4 D3 D2 P3 D1 P2 P1
由于被校验位位号 = 其校验位位号之和，因此，可知各个信息位所对应的校验位如下：
DD H(P1) H(P2) H(P3)
H(D4) 1 1 1
H(D3) 1 1
H(D2) 1 1
H(D1) 1 1
即，对于各个信息位，其相应的校验位位：
D4 : P1P2P3
D3 : P2P3
D2: P1 P3
D1: P1P2
即，对于各个校验位，其对应的信息位，及其存在的等式如下：
P1 = D4 xor D2 xor D1
P2 = D4 xor D3 xor D1
P3 = D4 xor D3 xor D2

3) 假设：
S1 = P1 xor D4 xor D2 xor D1
S2 = P2 xor D4 xor D3 xor D1
S3 = P3 xor D4 xor D3 xor D2
如果，S3S2S1 = 000，则，info传递无误；
如果，S3S2S1 = 101，则，2² + 2⁰ = 5，H5发生错误，只要将相应的电信号进行一个非门操作即可改正错误。
这里，错误的定位方式是根据原理：被校验位位号 = 校验位位号之和，来确定的。
式中，P3 , P1 对应的海明码号分别为 H4，H1，二者校验的信息位为 H5(D2)。

数据和文字的表示方法

猜你喜欢