-
编程语言发展路线
C语言是一种有类型语言,即变量在使用前,需要定义并确定类型。
C语言之后有两个发展方向:
-
更加强调类型,数据类型检查更严格,C++、JAVA;
面向底层,可以尽早发现问题。
-
不看重类型,甚至不用提前定义变量,Python、JavaScript、PHP;
过于强调类型,导致程序员过于注重底层,离应用越近,离底层越远。
-
-
C语言中的数据类型
-
数据类型的分类
C语言数据类型包含4个大类:
1、2、3称为C语言的基础类型。
-
数据类型有何不同
-
C语言中的运算符
-
sizeof
sizeof是一个静态运算符,给出某个类型或变量,在内存中所占据的字节数
sizeof(int) // int类型在内存中所占据的字节数 sizeof(i) // 变量i在内存中所占据的字节数,指的是变量i所对应数据类型在内存中的字节数 sizeof(function) size(int + 1.0) // int整数+1.0这个double,得到(int+1.0)是一个double,所以返回8
1个字节,是8个比特。
静态运算符
,指在编译程序过程中就确定了,并不会执行function里的操作。数据类型 sizeof/字节数 备注 char 1 short 2 int 4 取决于编译器,表达的是计算机的字长 long 8 32位机器编译是4个字节 long long 8 -
int反应字长
CPU(内部包含寄存器)与RAM(内存)之间有
总线
,提到字长,指的是寄存器的宽度。每个寄存器可以处理32个bit,同时总线一次传输的数据也是32bit。
int反应的是计算机的
字长
,想要表达的就是一个寄存器
的大小。比int小的,是计算机的几个位,比int大的表示
几个寄存器
拼起来。所有的
类型
,表示的是我们以什么样的方式去看待
它,而并不表示其在计算机内部是怎么表达
的。 -
1个字节
一个字节可以表达的数:
00000000-11111111(0-255)
-
如何表示负数
三个方案:
-
仿制十进制;
在8个bit之外,再增加一个符号。
在计算机内部需要用额外符号控制运算符,相当于控制把计算任务给加法还是减法或者是乘法,比较复杂。
-
取中间的数为0;
00000000-11111111中间的数就是10000000,用其表示0,比他小的是负数,比他大的是正数。
本来10000000是128的,这样就需要所有的数先减去128,得到可计算负数的替代数,还是会导致在输入输出过程比较复杂。
-
补码;
目标:希望得到-1+1=0;
已有:0–>00000000
1–>00000001
目标就成了,什么加上00000001得到00000000,可以知道是11111111,实际上得到100000000,但在8bit的硬件上,多出来的那个1就被丢掉了,实际上就得到了00000000(即0)。
在
纯二进制
角度,11111111是255,但是当作补码
时,其是-1。对于-a,其补码就是0-a,实际上就是 , 是这种类型的位数。
对于8位, 十进制是256,对应二进制就是100000000。
在二进制中,补码的意义就是拿补码和原码可以加出一个溢出的“零”。
这里的“零”,其实是(1)00000000,只不过因为物理限制,(1)被丢掉了。
补码的存在,导致一个字节(8个bit)所能代表的整数不再是(0-255),而是(-128-127)。
数据类型 所能表示的整数 备注 char -128-127 1个字节 short -32768-32767 2个字节 int 取决于编译器(CPU),通常意义是“1个字” long 4个字节 long long 8个字节 即计算机里的二进制(补码形式)其实并不是科学正确意义上的二进制。
对于一个字节(8位,即char类型),可以表达的数是
00000000-11111111
,在补码形式下二进制与数据的对应关系是:-
00000000 --> 0
不管是计算机补码形式,还是科学正确意义,00000000都表示0;
-
00000001 ~ 01111111 --> 1 ~ 127从小到大
最高位为0的这些二进制,同样不管是科学正确还是补码,都正常表示二进制与十进制的对应关系;
-
11111111 ~ 10000000 --> -1 ~ -128从大到小
最高位为1(数据类型所有位中的第一个位)的这些二进制,科学正确与补码是不一样的,从科学正确角度11111111表示255,从补码角度11111111表示-1。但
前提是在一个字节的整数上
,如果是多字节(int 4字节),11111111就还是255,因为int有4个字节32位,只是最后一个字节里的位上都是1,但前面还有24个字节是0,因此还是个正数
如果不想让计算机以补码形式使用二进制(-128,127),可以通过
unsigned
表示不使用补码。当时unsigned的设计初衷是为了做纯二进制计算,即移位。
-
-
数据之环
计算机中数据类型表示的整数是有范围的,且首位可以切换:
且这个原理,无关乎是否采用
unsigned
,unsigned
只是改变了计算机所能表示数据的大小范围,而本节所说的数据之环是计算机硬件的物理特性。
-
-
References
- 翁恺, C语言程序设计, B站, 6.1.1 - 6.1.4