翁恺C语言程序设计:学习笔记4

  • 编程语言发展路线

    C语言是一种有类型语言,即变量在使用前,需要定义确定类型

    C语言之后有两个发展方向:

    1. 更加强调类型,数据类型检查更严格,C++JAVA

      面向底层,可以尽早发现问题。

    2. 不看重类型,甚至不用提前定义变量,PythonJavaScriptPHP

      过于强调类型,导致程序员过于注重底层,离应用越近,离底层越远。

  • C语言中的数据类型

  • 数据类型的分类

    C语言数据类型包含4个大类:

    1. 整数(包括:逻辑)
      • int
      • char
      • short
      • long
      • longlong
      • boll(逻辑)
    2. 浮点数
      • float
      • double
      • long double
    3. 指针
    4. 自定义类型

    1、2、3称为C语言的基础类型。

  • 数据类型有何不同
    • 类型名称
    • 输入输出时格式化不同
    • 所表达的数的范围

      char < short < int < float < double

    • 内存中所占据的大小

      char --> 1个字节

      double --> 16个字节

      扫描二维码关注公众号,回复: 8540646 查看本文章
    • 内存中的表达形式
      • 二进制数(补码)

        int

      • 编码

        float,两个浮点数是没法在计算机(加法器)上直接计算的。

  • C语言中的运算符

  • sizeof

    sizeof是一个静态运算符,给出某个类型或变量,在内存中所占据的字节数

    sizeof(int) // int类型在内存中所占据的字节数
    sizeof(i) // 变量i在内存中所占据的字节数,指的是变量i所对应数据类型在内存中的字节数
    sizeof(function)
    size(int + 1.0) // int整数+1.0这个double,得到(int+1.0)是一个double,所以返回8
    

    1个字节,是8个比特。

    静态运算符,指在编译程序过程中就确定了,并不会执行function里的操作。

    数据类型 sizeof/字节数 备注
    char 1
    short 2
    int 4 取决于编译器,表达的是计算机的字长
    long 8 32位机器编译是4个字节
    long long 8
  • int反应字长

    CPU(内部包含寄存器)与RAM(内存)之间有总线,提到字长,指的是寄存器的宽度。

    每个寄存器可以处理32bit,同时总线一次传输的数据也是32bit

    int反应的是计算机的字长,想要表达的就是一个寄存器的大小。

    int小的,是计算机的几个位,比int大的表示几个寄存器拼起来。

    所有的类型,表示的是我们以什么样的方式去看待它,而并不表示其在计算机内部是怎么表达的。

  • 1个字节

    一个字节可以表达的数:

    00000000-11111111(0-255)

  • 如何表示负数

    三个方案:

    1. 仿制十进制;

      8bit之外,再增加一个符号。

      在计算机内部需要用额外符号控制运算符,相当于控制把计算任务给加法还是减法或者是乘法,比较复杂。

    2. 取中间的数为0;

      00000000-11111111中间的数就是10000000,用其表示0,比他小的是负数,比他大的是正数。

      本来10000000128的,这样就需要所有的数先减去128,得到可计算负数的替代数,还是会导致在输入输出过程比较复杂。

    3. 补码;

      目标:希望得到-1+1=0;

      已有:0–>00000000

      ​ 1–>00000001

      目标就成了,什么加上00000001得到00000000,可以知道是11111111,实际上得到100000000,但在8bit的硬件上,多出来的那个1就被丢掉了,实际上就得到了00000000(即0)。

      纯二进制角度,11111111是255,但是当作补码时,其是-1。

      对于-a,其补码就是0-a,实际上就是 2 n a 2^n-a n n 是这种类型的位数。

      对于8位, 2 8 2^8 十进制是256,对应二进制就是100000000。

      在二进制中,补码的意义就是拿补码和原码可以加出一个溢出的“零”。

      这里的“零”,其实是(1)00000000,只不过因为物理限制,(1)被丢掉了。

      补码的存在,导致一个字节(8个bit)所能代表的整数不再是(0-255),而是(-128-127)。

      数据类型 所能表示的整数 备注
      char -128-127 1个字节
      short -32768-32767 2个字节
      int ( 2 32 1 , 2 32 1 1 ) (-2^{32-1},2^{32-1}-1) 取决于编译器(CPU),通常意义是“1个字”
      long 4个字节
      long long 8个字节

      即计算机里的二进制(补码形式)其实并不是科学正确意义上的二进制。

      对于一个字节(8位,即char类型),可以表达的数是00000000-11111111,在补码形式下二进制与数据的对应关系是:

      • 00000000 --> 0

        不管是计算机补码形式,还是科学正确意义,00000000都表示0;

      • 00000001 ~ 01111111 --> 1 ~ 127从小到大

        最高位为0的这些二进制,同样不管是科学正确还是补码,都正常表示二进制与十进制的对应关系;

      • 11111111 ~ 10000000 --> -1 ~ -128从大到小

        最高位为1(数据类型所有位中的第一个位)的这些二进制,科学正确与补码是不一样的,从科学正确角度11111111表示255,从补码角度11111111表示-1。但前提是在一个字节的整数上,如果是多字节(int 4字节),11111111就还是255,因为int有4个字节32位,只是最后一个字节里的位上都是1,但前面还有24个字节是0,因此还是个正数

      如果不想让计算机以补码形式使用二进制(-128,127),可以通过unsigned表示不使用补码。

      当时unsigned的设计初衷是为了做纯二进制计算,即移位。

    4. 数据之环

      计算机中数据类型表示的整数是有范围的,且首位可以切换:

      • 最大值再加1,得到最小值

        从纯粹二进制角度,最大值+1得到的二进制超过了计算机所能容纳的位数,去掉最左边一位后,剩下的位数在计算机中正好表示最小值。

      • 最小值再减1,得到最大值

        同样道理

      且这个原理,无关乎是否采用unsignedunsigned只是改变了计算机所能表示数据的大小范围,而本节所说的数据之环是计算机硬件的物理特性。

  • References

  1. 翁恺, C语言程序设计, B站, 6.1.1 - 6.1.4
发布了753 篇原创文章 · 获赞 1021 · 访问量 54万+

猜你喜欢

转载自blog.csdn.net/The_Time_Runner/article/details/103794901