计算机编码(电脑内部代表字母或数字的方式)如:Unicode、UTF-8、UTF-16、ASCII等

       作为一个计算机专业的学生,怎么和那些非计算机专业的学生区分开呢?当然是懂得计算机名词更多一些了,能通俗易懂的解释就更好了。这几天突然接触到计算机的编码,查了一些资料,下面说说自己的理解吧,欢迎批评指正,谢谢。

什么是编码?       

       大家都知道计算机只能看懂0和1,因为0和1分别代表电路的断开和接通,或者电压的低和高,或者电阻的小和大,或者温度的底和高。人们进行编码的意义在于能让计算机看懂人类的信息。假如在计算机中输入“我喜欢你”,计算机看不懂你说的什么,因为他只能读懂0和1这些数字呀。所以呢,我们先在计算机中编写一本字典告诉它:

000
001
010
011

这时候计算机就会对照这本字典来理解的你的意思,哦,原来你说的是000 001 010 011,如果发给你女朋友的电脑的话,女朋友的电脑就会接收到这一串数字啦000 001 010 011,这时候呢你女朋友的电脑就会根据这个字典翻译过来,哦,原来你发送的是“我喜欢你”这个信息呀。以上所说的这本字典就是计算机的编码了。

都有什么编码方式呢?(都有什么字典呢?)

哦对了你别忘了,计算机是人家美国人发明的,人家造的字典怎么会有汉字呢,不可能呀。因为刚开始他们可没有想到将来的某一天我们中国的计算机会发展到这么快,而且成为世界上网民最多的国家。所以人家刚造字典的时候只是把美国的26个英文字母,和一些英文常用的符号编进去了。这本字典呢就叫做ASCII(American Standard Code for Information Interchange,美国信息交换标准代码码。

我就先截取字典的一部分吧

看到了没,左边那计算机能看懂的0和1,右边是美国人能看懂的英文字母,这就是人家的字典呀。

       计算机发展这么快,方便了人们的生活,怎么能阻止进入到其他的国家呢?这时候来到了中国。哎呀,美国的字典用8位二进制(0和1)就能代表了,2的8次方为256个字符,美国也就这么多字符呀,字典比较薄,用不了几位就够了。但是怎么中国,泱泱大国,中华上下五千年,发明了这么多的汉字,常用的汉字就有3500个,小小8位的字典的怎么能存储这么多的汉字。所以中国就发明了自己的字典(编码)GBK等。目的就是把中国的汉字存储到计算机中让计算机理解呀。

        中国的汉字计算机能理解了,印度、日本、韩国人家也得用电脑呀,所以大家都在编写自己的字典(编码方式)。这时候就完了,哎呀,中国想日本发了一个“我爱你”,中国的电脑查了一下字典是“000111010”发到日本的电脑,日本的电脑查了一下自己的电脑“000111010”代表“私はあなたを恨む”(翻译成中文是我恨你),哎呀,你说尴不尴尬,本来上一辈人就有点仇,这岂不人不能缓解大家的仇恨。所以造成国与国之间的电脑不能通信,互相不理解。甚至中国的香港不能和大陆的计算机通信。计算机的出现时拉近国与国之间的距离的不是加大距离的。这事儿得管。谁来管呢,国际上派个组织吧,你出面大家都信服,这时候编写了一本世界通用的字典Unicode,这本字典就厉害了,把全世界的各个国家各个名族的字符都写进去了。所以去世界大家都用一本字典,就不会有矛盾了。至于这本字典呢,你可以自己查查。

        字典存储的字符越多字典肯定越后,每个字符占用的空间越大,比如在美国字典00001111就代表A,但是走到世界字典里就得用0000000000001111代表A,这就占用了大量的存储空间,而且也不容易在互联网上传输呀,加大了传输错误的概率。如果一个公司只有在美国用的话,人家就不必用世界通用字典呀,就像你一辈子不出国,不和外国人交流,会不会查英文字典无所谓的。这时候又发明了长度可变的编码utf-8,utf-16。

        由于时间问题先写到这里,有时间更新。


       

猜你喜欢

转载自blog.csdn.net/raven_csdn/article/details/81048523
今日推荐