非数值数据
没有具体值得数据,在坐标轴上找不到对应点。如逻辑真假,西文字符,汉字,音频,图片等等。
逻辑数据
- 0表示假
- 1表示真
逻辑数据会进行的运算,按位与,按位或,逻辑左移,逻辑右移等等。
西文字符
如a至z,A至Z,=,空格,0至9等等。
字符总数不超过256,所以可以用8个2进制表示。
使用ASCII码表示西文字符。
几个常见字母的ASCII码大小: “A”为65;“a”为97;“0”为 48。
前32位包括控制字符和空格
汉字
汉字不像西文字符,数量巨大,超过6万个汉字。所以需要特殊处理。所以需要引入输入码,内码,字形码。
输入码(外码)
对汉字用相应按键进行编码表示,用于输入。
输入的几种方式:手写,语言,键盘拼写等。
西文字符无输入码,按下按键就能输入进去
内码
用于在系统中进行查找,储存,传送等处理。
西文字符的内码就是ASCII
区位码
将汉字按一定顺序排列存放在一个二维表格中,这个表有94行,94列(由汉字个数决定),每行的行数是区号,列数是位号,每个汉字都有唯一对应的位置。用7个二进制数可表示94个数,所以各占7位。共14位,左7位是区号,右7位是位号。
国标码
在区位码的区号和位号各加32得到国标码,为什么是32呢,因为ASCII码的前32包括控制字符和空格。
在计算机中为了方便处理,在左右7位前面各加1个0,构成两个字节。
一种内码
为了与西文字符区别,将国标码的每个字节第一位换成1,得到一种内码。
比如说:汉字里的“大”位于第20行,第83列。20对应二进制是00010100,83对应的二进制是01010011。区号和位号各加32,32对应的二进制是00100000,得到的国标码是00110100 01110011,即3473H,34H是字符4的ASCII码,73H是字符s的ASCII码。所以最高位设1,得到的内码是10110100 11110011,即B4F3,这样就不会和西文字符混淆。
字形码(机内码)
描述汉字字形或轮廓,用于显示或打印。
- 不同的字体(宋体,黑体,楷体等)有不同的字库。
- 无论什么字,都有字形码,除非你不想让人们看到字。
描述方式:
- 点阵描述,类似于像素画。
可以这样表示汉字“十”。 - 轮廓描述,有直线的,也有曲线的。