翁恺C语言程序设计：学习笔记4

编程语言发展路线

C语言是一种有类型语言，即变量在使用前，需要定义并确定类型。

C语言之后有两个发展方向：
1. 更加强调类型，数据类型检查更严格，C++、JAVA；
  
  面向底层，可以尽早发现问题。
2. 不看重类型，甚至不用提前定义变量，Python、JavaScript、PHP；
  
  过于强调类型，导致程序员过于注重底层，离应用越近，离底层越远。
C语言中的数据类型
数据类型的分类

C语言数据类型包含4个大类：
1. 整数（包括：逻辑）
  - int
  - char
  - short
  - long
  - longlong
  - boll（逻辑）
2. 浮点数
  - float
  - double
  - long double
3. 指针
4. 自定义类型
1、2、3称为C语言的基础类型。
数据类型有何不同
- 类型名称
- 输入输出时格式化不同
- 所表达的数的范围
  
  char < short < int < float < double
- 内存中所占据的大小
  
  char --> 1个字节
  
  double --> 16个字节
  
  扫描二维码关注公众号，回复： 8540646 查看本文章
- 内存中的表达形式
  - 二进制数（补码）
    
    int
  - 编码
    
    float，两个浮点数是没法在计算机（加法器）上直接计算的。
C语言中的运算符

sizeof

sizeof是一个静态运算符，给出某个类型或变量，在内存中所占据的字节数

sizeof(int) // int类型在内存中所占据的字节数
sizeof(i) // 变量i在内存中所占据的字节数，指的是变量i所对应数据类型在内存中的字节数
sizeof(function)
size(int + 1.0) // int整数+1.0这个double，得到(int+1.0)是一个double，所以返回8

1个字节，是8个比特。

静态运算符，指在编译程序过程中就确定了，并不会执行function里的操作。

数据类型	sizeof/字节数	备注
char	1
short	2
int	4	取决于编译器，表达的是计算机的字长
long	8	32位机器编译是4个字节
long long	8

int反应字长

CPU（内部包含寄存器）与RAM（内存）之间有总线，提到字长，指的是寄存器的宽度。

每个寄存器可以处理32个bit，同时总线一次传输的数据也是32bit。

int反应的是计算机的字长，想要表达的就是一个寄存器的大小。

比int小的，是计算机的几个位，比int大的表示几个寄存器拼起来。

所有的类型，表示的是我们以什么样的方式去看待它，而并不表示其在计算机内部是怎么表达的。
1个字节

一个字节可以表达的数：

00000000-11111111（0-255）

如何表示负数

三个方案：

仿制十进制；

在8个bit之外，再增加一个符号。

在计算机内部需要用额外符号控制运算符，相当于控制把计算任务给加法还是减法或者是乘法，比较复杂。
取中间的数为0;

00000000-11111111中间的数就是10000000，用其表示0，比他小的是负数，比他大的是正数。

本来10000000是128的，这样就需要所有的数先减去128，得到可计算负数的替代数，还是会导致在输入输出过程比较复杂。

补码;

目标：希望得到-1+1=0；

已有：0–>00000000

1–>00000001

目标就成了，什么加上00000001得到00000000，可以知道是11111111，实际上得到100000000，但在8bit的硬件上，多出来的那个1就被丢掉了，实际上就得到了00000000（即0）。

在纯二进制角度，11111111是255，但是当作补码时，其是-1。

对于-a，其补码就是0-a，实际上就是 $2^n-a$ ， $n$ 是这种类型的位数。

对于8位， $2^8$ 十进制是256，对应二进制就是100000000。

在二进制中，补码的意义就是拿补码和原码可以加出一个溢出的“零”。

这里的“零”，其实是(1)00000000,只不过因为物理限制，(1)被丢掉了。

补码的存在，导致一个字节（8个bit）所能代表的整数不再是(0-255)，而是(-128-127)。

数据类型	所能表示的整数	备注
char	-128-127	1个字节
short	-32768-32767	2个字节
int	$(-2^{32-1},2^{32-1}-1)$	取决于编译器(CPU)，通常意义是“1个字”
long		4个字节
long long		8个字节

即计算机里的二进制（补码形式）其实并不是科学正确意义上的二进制。

对于一个字节（8位，即char类型），可以表达的数是00000000-11111111,在补码形式下二进制与数据的对应关系是：

00000000 --> 0

不管是计算机补码形式，还是科学正确意义，00000000都表示0；
00000001 ~ 01111111 --> 1 ~ 127从小到大

最高位为0的这些二进制，同样不管是科学正确还是补码，都正常表示二进制与十进制的对应关系；
11111111 ~ 10000000 --> -1 ~ -128从大到小

最高位为1（数据类型所有位中的第一个位）的这些二进制，科学正确与补码是不一样的，从科学正确角度11111111表示255，从补码角度11111111表示-1。但前提是在一个字节的整数上，如果是多字节（int 4字节），11111111就还是255，因为int有4个字节32位，只是最后一个字节里的位上都是1，但前面还有24个字节是0，因此还是个正数

如果不想让计算机以补码形式使用二进制（-128，127），可以通过unsigned表示不使用补码。

当时unsigned的设计初衷是为了做纯二进制计算，即移位。

数据之环

计算机中数据类型表示的整数是有范围的，且首位可以切换：
- 最大值再加1，得到最小值
  
  从纯粹二进制角度，最大值+1得到的二进制超过了计算机所能容纳的位数，去掉最左边一位后，剩下的位数在计算机中正好表示最小值。
- 最小值再减1，得到最大值
  
  同样道理
且这个原理，无关乎是否采用unsigned，unsigned只是改变了计算机所能表示数据的大小范围，而本节所说的数据之环是计算机硬件的物理特性。

References

翁恺, C语言程序设计, B站, 6.1.1 - 6.1.4

Quant_Learner

发布了753 篇原创文章 · 获赞 1021 · 访问量 54万+

他的留言板关注