【Docker】镜像分层存储与镜像精简

Linux操作系统

Linux操作系统由内核空间和用户空间组成。

内核空间是kernel，用户空间是rootfs, 不同Linux发行版的区别主要是rootfs.比如 Ubuntu 14.04 使用 upstart 管理服务，apt 管理软件包；而 CentOS 7 使用 systemd 和 yum。这些都是用户空间上的区别，Linux kernel 差别不大。
所以 Docker 可以同时支持多种 Linux 镜像，模拟出多种操作系统环境。

分层存储

　　因为镜像包含操作系统完整的 root 文件系统，其体积往往是庞大的，因此在 Docker 设计时，就充分利用 Union FS 的技术，将其设计为分层存储的架构。所以严格来说，镜像并非是像一个 ISO 那样的打包文件，镜像只是一个虚拟的概念，其实际体现并非由一个文件组成，而是由一组文件系统组成，或者说，由多层文件系统联合组成。
　　镜像构建时，会一层层构建，前一层是后一层的基础。每一层构建完就不会再发生改变，后一层上的任何改变只发生在自己这一层。比如，删除前一层文件的操作，实际不是真的删除前一层的文件，而是仅在当前层标记为该文件已删除。在最终容器运行的时候，虽然不会看到这个文件，但是实际上该文件会一直跟随镜像。因此，在构建镜像的时候，需要额外小心，每一层尽量只包含该层需要添加的东西，任何额外的东西应该在该层构建结束前清理掉。
　　分层存储的特征还使得镜像的复用、定制变的更为容易。甚至可以用之前构建好的镜像作为基础层，然后进一步添加新的层，以定制自己所需的内容，构建新的镜像。

docker镜像原理

　　docker镜像在构建的时候利用了aufs文件系统的挂载原理，对文件系统进行构建。
　　首先,存在一个 docker 容器在启动时其内部进程可见的文件系统视角,或者称为docker 容器的根目录rootfs。目录下含有 docker 容器所需要的系统文件、工具、容器文件等。（只读属性）
　　接着，在特定的镜像中存在每一个镜像独有的文件系统（读写属性），以ubuntu镜像为例，如下图：

　　在docker实际应用中，镜像相当于只读层，而容器则相当去上图中的可写层。已构建的镜像会设置成只读模式，read-write写操作是在read-only上的一种增量操作，固不影响read-only层。
无论是unbuntu这种OS系统，还是mysql,mongo这种具体应用。docker利用的aufs文件系统在文件系统挂载时对镜像进行复用。
所以我们假设 docker build 构建出来的镜像名分别为 image 1 和 image 2，由于两个 Dockerfile 均基于ubuntu:14.04，因此，image 1 和 image 2 这两个镜像均复用了镜像 ubuntu:14.04。假设 RUN apt-get update 修改的文件系统内容为 20 MB，最终本地三个镜像的大小关系应该如下：

 ubuntu:14.04： 200 MB
 image 1：200 MB（ubuntu:14.04 的大小）+ 20 MB = 220 MB
 image 2：200 MB（ubuntu:14.04 的大小）+ 100 MB = 300 MB

　　如果仅仅是单纯的累加三个镜像的大小，那结果应该是：200 + 220 + 300 = 720 MB，但是由于镜像复用的存在，实际占用的磁盘空间大小是：200 + 20 + 100 + 320 MB，足足节省了 400 MB 的磁盘空间。在此，足以证明镜像复用的巨大好处。
　　由此可以说明docker images 列表下镜像大小之和并非是镜像实际硬盘消耗．