容器中数据管理主要有两种方式:
数据卷(Data Volumes):容器内数据直接映射到本地主机地址;
数据卷容器(Data Volume Containers):使用特定容器维护数据卷。
一、数据卷
数据卷是一个可供容器使用的特殊目录,它将主机操作系统目录直接映射进容器。
特性:
1) 数据卷可以在容器之间共享和重用,容器间传递数据将变得高效方便;
2) 对数据卷内数据的修改会立马生效,无论是容器内操作还是本地操作;
3) 对数据卷的更新不会影响镜像,解耦了应用和数据;
4) 卷会一直存在,直到没有容器使用,可以安全地卸载它。
1、在容器内创建一个数据卷
运行docker run命令时,使用-v即可在容器内创建一个数据卷。多次重复使用-v可以创建多个数据卷。例如:
docker run -d -P --name web -v /webapp training/webapp python app.py
-P是将容器服务暴露的端口,是自动映射到本地主机的临时端口。
2、挂载一个主机目录作为数据卷(推荐)
docker run -d -P --name web -v /src/webapp:/opt/webapp training/webapp python app.py
用户可以将一些程序或数据放到本地目录中,然后在容器内运行和使用。本地目录的路径必须是绝对路径,如果目录不存在,Docker会自动创建。Docker挂载数据卷的默认权限是读写(rw),用户也可以通过ro指定为只读。例如:
docker run -d -P --name web -v /src/webapp:/opt/webapp:ro training/webapp python app.py
3、挂载一个本地主机文件作为数据卷(不推荐)
docker run --rm -it -v ~/.bash_history://.bash_history ubuntu /bin/bash
如果直接挂载一个文件到容器,使用文件编辑工具,包括vi或者sed --in-place的时候,可能会造成文件inode的改变,从Docker 1.1.0起,会导致报错。
二、数据卷容器
如果用户需要在多个容器之间共享一些持续更新的数据,可以使用数据卷容器。数据卷容器也是一个容器,它的目的是专门用来提供数据卷供其他容器挂载。
首先创建一个数据卷容器,并在其中创建一个数据卷挂载到本地目录,然后在其他容器中使用--volumes-from来挂载数据卷容器中的数据卷。每一个容器任何一方在该目录下写入,其他容器都可以看到。此外,还可以从其他已经挂载了容器卷的容器来挂载数据卷。
(使用--volumes-from参数所挂载数据卷的容器自身并不需要保持在运行状态)
如果删除了挂载的容器,数据卷并不会被自动删除。如果要删除一个数据卷,必须在最后一个还挂载着它的容器时显式使用docker rm -v命令来指定同时删除关联的容器。
三、利用数据卷容器迁移数据
1、备份
docker run --volumes-from dbdata -v $(pwd):/backup --name worker ubuntu tar cvf /backup/backup.tar /dbdata
① 首先利用ubuntu镜像创建了一个容器worker,使用--volumes-from dbdata参数来让worker容器挂载dbdata容器的数据卷,使用-v $(pwd):/dbdata参数来挂载本地的当前目录到worker容器的/backup目录。
② worker容器启动后,使用了tar cvf/backup/backup.tar /dbdata来将/dbdata下内容备份为容器内的/backup/backup.tar,即宿主主机当前目录下的backup.tar。
2、恢复
首先创建一个带有数据卷的容器dbdata2
docker run -v /dbdata --name dbtada2 ubuntu /bin/bash
然后创建另一个新的容器,挂载dbdata2的容器,并使用untar解压备份文件到所挂载的容器卷中
docker run --volumes-from dbdata2 -v $(pwd):/backup busybox tar xvf /backup/backup.tar