【学习计算机组成原理】非数值数据的表示

非数值数据

没有具体值得数据,在坐标轴上找不到对应点。如逻辑真假,西文字符,汉字,音频,图片等等。

逻辑数据

  • 0表示假
  • 1表示真

逻辑数据会进行的运算,按位与,按位或,逻辑左移,逻辑右移等等。

西文字符

如a至z,A至Z,=,空格,0至9等等。
字符总数不超过256,所以可以用8个2进制表示。
使用ASCII码表示西文字符。
在这里插入图片描述
几个常见字母的ASCII码大小: “A”为65;“a”为97;“0”为 48。
前32位包括控制字符和空格

汉字

汉字不像西文字符,数量巨大,超过6万个汉字。所以需要特殊处理。所以需要引入输入码,内码,字形码。

输入码(外码)

对汉字用相应按键进行编码表示,用于输入。
输入的几种方式:手写,语言,键盘拼写等。
西文字符无输入码,按下按键就能输入进去

内码

用于在系统中进行查找,储存,传送等处理。
西文字符的内码就是ASCII

区位码

将汉字按一定顺序排列存放在一个二维表格中,这个表有94行,94列(由汉字个数决定),每行的行数是区号,列数是位号,每个汉字都有唯一对应的位置。用7个二进制数可表示94个数,所以各占7位。共14位,左7位是区号,右7位是位号。

国标码

在区位码的区号和位号各加32得到国标码,为什么是32呢,因为ASCII码的前32包括控制字符和空格。
在计算机中为了方便处理,在左右7位前面各加1个0,构成两个字节。

一种内码

为了与西文字符区别,将国标码的每个字节第一位换成1,得到一种内码。
比如说:汉字里的“大”位于第20行,第83列。20对应二进制是00010100,83对应的二进制是01010011。区号和位号各加32,32对应的二进制是00100000,得到的国标码是00110100 01110011,即3473H,34H是字符4的ASCII码,73H是字符s的ASCII码。所以最高位设1,得到的内码是10110100 11110011,即B4F3,这样就不会和西文字符混淆。

字形码(机内码)

描述汉字字形或轮廓,用于显示或打印。

  • 不同的字体(宋体,黑体,楷体等)有不同的字库。
  • 无论什么字,都有字形码,除非你不想让人们看到字。
    描述方式:
  1. 点阵描述,类似于像素画。
    在这里插入图片描述
    可以这样表示汉字“十”。
  2. 轮廓描述,有直线的,也有曲线的。
发布了36 篇原创文章 · 获赞 34 · 访问量 3228

猜你喜欢

转载自blog.csdn.net/weixin_44611096/article/details/105211533