概念:计算机系统是由硬件和软件组成的,它们共同工作来运行应用程序。
目标:理解底层计算机系统的本质和如何影响应用程序。
从本书可以学到:
- 一些实践技巧,比如如何避免由计算机表示数字方式引起的奇怪的数字错误;
- 通过一些运用了现代处理器和存储器系统的设计的小窍门来优化C代码;
- 了解到编译器是如何实现过程调用的,并且了解到如何利用这个知识来避免缓存区溢出错误带来的安全漏洞;
- 学会如何认识和避免链接时那些令人讨厌的错误;
- 学会如何编写自己的Unix shell、自己的动态存储分配包,甚至于自己的Web服务器
- ……
1.1 信息就是位+上下文
- hello源程序实际上就是一个由0和1组成的位(又称为bit/比特)序列,这些位八日组织成8个一组,称为字节。每个字节都表示程序中某个文本字符。
- ASCII标准码其实就是用一个唯一的字节大小的整数值来表示每个字符。
- hello.c程序是以字节序列的方式储存在文件中的。
- 系统中所有的信息——包括磁盘文件、存储器中的程序、存储器中存放的用户数据以及网络上传送的数据,都是由一串比特表示的。区分不同数据对象的唯一方法是我们读到这些数据对象时的上下文。
1.2 程序被其他程序翻译成不同的格式
- 为了在系统上运行hello.c程序,每条C语句都必须都被其他程序转化为一系列的低级机器语言指令。然后这些指令按照一种称为可执行目标程序(executable object program)的格式打包好,并以二进制磁盘文件的形式存放起来。目标程序也称为可执行目标文件(executable object file)。
编译系统构成:
- 预处理器:hello.c --> hello.i
- 编译器:hello.i --> hello.s
- 汇编器:hello.s --> hello.o
- 链接器:hello.o --> hello(可执行目标程序)
四个阶段:
- 预处理阶段:预处理器根据字符#开头的命令(directives)修改原始的C程序。
- 编译阶段:将文本文件hello.i翻译成文本文件hello.s,它包含一个汇编语言程序。
- 汇编阶段:汇编器将hello.s翻译成机器语言指令。把这些指令打包成一种叫做可重定位(relocatable)目标程序地格式,并将结果保存在目标文件hello.o中。
- 链接阶段:链接器负责将预编译目标文件并入到hello.o程序中,结果得到hello文件。
可执行文件加载到存储器后,由系统负责执行。
1.3 了解编译系统如何工作是大有益处的
- 促使程序员必须知道编译系统是如何工作的原因:
- 优化程序性能。
- 理解链接时出现的错误。
- 避免安全漏洞。
1.4 处理器读出并解释储存在存储器中的指令
1.4.1 系统的硬件组成
- 总线
- 贯穿整个系统的是一组电子管道,称作总线,它携带信息字节并负责在各个部件间传递。
- I/O设备
- I/O设备是系统与外界的联系通道。
- 每个I/O设备都是通过一个控制器或适配器与I/O总线连接起来的,功能是在I/O总线和I/O设备之间传递信息。
- 主存
- 主存是一个临时存储设备,在处理器执行程序时,它被用来存放程序和程序处理的数据。
- 处理器
- 中央处理单元(CPU)简称处理器,是解释存储在主存中指令的引擎。
- 寄存器文件是一个小的存储设备,由一些字长大小的寄存器组成,这些寄存器每个都有唯一的名字。
1.4.2 执行hello程序
1.5 高速缓存
- 系统设计的一个主要目标就是使拷贝操作尽可能的快。
- 这本书重要的课题之一就是应用程序员通过理解高速缓存存储器的机理,能够利用这些知识极大地提高程序的性能。
1.6 形成层次结构的存储设备
- 存储器分层结构的主要思想是一个层次上的存储器作为下一层次上的存储器的高速缓存。
1.7 操作系统管理硬件
- 可以把操作系统看成是应用程序和硬件之间插入的一层软件,所有应用程序对硬件的操作尝试都必须通过操作系统。
- 操作系统有两个基本功能:防止硬件被失控的应用程序滥用;在控制复杂而又通常广泛不同的低级硬件设备方面,为应用程序提供简单一致的方法。
- 操作系统通过几个基本的抽象概念(进程、虚拟存储器和文件)实现这两个功能。
- 文件是对I/O设备的抽象表示
- 虚拟存储器是对主存和磁盘I/O设备的抽象表示
- 进程是对处理器、主存和I/O设备的抽象表示
1.7.1 进程
- 进程是操作系统对运行程序的一种抽象。
- 在一个系统上可以同时运行多个进程,而每个进程都好像在独占地使用硬件。我们称之为并发运行,实际上是说开一个进程的指令和另一个进程的指令是交错执行的。操作系统实现这种交错执行的机制称为上下文切换(context switching)。
1.7.2 线程
- 现代系统中,一个进程实际上可以由多个称为线程的执行单元组成,每个线程都运行在进程的上下文中,并共享同样的代码和全局数据。
1.7.3 虚拟存储器
- 虚拟内存器是一个抽象概念,它为每个进程提供了一个假象,好像每个进程都在独占地使用内存。每个进程看到的存储器都是一致的,称之为虚拟地址空间。
- 虚拟空间区域:
- 程序代码和数据
- 堆
- 共享库
- 栈:位于用户虚拟地址空间顶部的是用户栈,编译器用它来实现函数调用。
- 内核虚拟存储器:内核是操作系统总是驻留在存储器中的部分。应用程序不允许读写这个区域的内容或者直接调用内核代码定义的函数。
1.7.4 文件
1.8 利用网络系统和其他系统通信
1.9 下一步
- 系统是互相交织的硬件和系统软件的集合体,它们必须共同给协作以达到运行应用程序的最终目的。
1.10 小结
- 操作系统内核是应用程序和硬件之间的媒介。