docker入门(五)docker数据管理

在生产环境中使用docker,往往需要对数据进行持久化,或者需要在多个容器之间进行数据共享,这必然涉及到容器的数据管理操作。

容器中的管理数据主要有两种方式:

  • 数据卷:容器内数据映射到本地主机环境
  • 数据卷容器:使用特定容器维护数据卷

1.1.数据卷

数据卷是一个可供容器使用的特殊目录,类似于linux中的tomcat行为。

数据卷的特性:

  • 数据卷可以在容器之间共享和重用,容器间传递数据将变得高效与方便
  • 对数据卷内数据的修改会立马生效,无论是容器内操作还是本地操作
  • 对数据卷的更新不会影响镜像,解耦开应用和数据
  • 卷会一直存在,直到没有容器使用,可以安全的卸载它

1.1.1.创建数据卷

docker提供volume子命令来管理数据卷,如下命令可以快速的在本地创建一个数据卷:

docker volume create -d local test

此时/var/lib/docker/volumes下会发现所创建的数据卷位置

除了create命令,还有inspect(查看详细信息)、ls(列出已有数据卷)、prune(清理无用数据卷)、rm(删除数据卷)等。

1.1.2.绑定数据卷

再使用docker run命令时,可以使用-mount选项来使用数据卷。

-mount选项支持三种类型的数据卷:

  • volume:普通数据卷,映射到主句/var/lib/docker/volumes路径下
  • bind:绑定数据卷,映射到主机指定路径下
  • tmpfs:临时数据卷,只存在于内存中

栗子:使用training/webapp镜像创建一个web容器,并创建一个数据卷挂载到容器的/opt/webapp目录

docker run -d -P --name web --mount type=bind,source=/webapp,destination=/opt/wenapp training/webapp python app.py

上述命令等同于使用旧的-v标记可以再容器内创建一个数据卷:

docker run -d -P --name web -v /webapp:/opt/webapp training/webapp python app.py

注意:本地的路径必须是绝对路径,容器内的路径可以为相对路径。如果目录不存在,docker会自动创建。

 docker挂载数据卷的默认权限为读写(rw),用户也可以通过ro指定为只读:

docker run -d -P --name web -v /webapp:/opt/webapp:ro training/webapp python app.py

加了ro之后,容器内对所挂载数据卷内的数据就无法修改了。

注意:如果直接挂载一个文件,在使用文件编辑工具(vi,sed等)之后,可能会造成文件inode的改变。从docker1.1.0起,这会导致报错误信息,所以推荐直接挂载文件所在的目录到容器内。

2.1.数据卷容器

如果用户需要在多个容器之间共享一些持续更新的数据,最简单的方式是使用数据卷容器。数据卷容器也是一个容器,但是它的目的是专门提供数据卷给其他容器挂载。

首先,创建一个数据卷容器dbdata,并在其中创建一个数据卷挂载到/dbdata:

docker run -it -v /dbdata --name dbdata ubuntu
ls
显示:
bin boot dbdata dev etc home lib li64 media mnt opt proc root run sbin srv sys tmp usr var

然后可以再其他容器中使用--volumes-from来挂载dbdata容器中的数据卷,例如创建db1和db2两个容器,并从dbdata容器挂载数据卷

docker run -it --volums-from dbdata --name db1 ubuntu

docker run -it --volums-from dbdata --name db2 ubuntu

此时,db1和db2都挂载了同一个数据卷到相同的/dbdata目录,三个容器任何一个在该目录下写入,其他都可以看到。

在dbdata容器中创建一个test文件:

cd /dbdata

touch test

  

在db1容器内查看:

docker run -it --volumes-from dbdata --name db1 ubuntu

ls /dbdata

显示:

test

  

可以多次使用--volumes-from 参数来从多个容器挂载多个数据卷,还可以从其他已经挂载了容器卷的容器来挂载数据卷:

docker run -d --name db3 --volumes-from db1 training/postgres

  

注意:使用--volumes-from参数所挂载数据卷的容器自身并不需要保持在运行状态

如果删除了挂载的容器(dbdata、db1、db2),数据卷并不会被自动删除。要删除它,必须在删除最后一个挂载着他的容器时显示使用docker rm -v命令来指定删除关联的容器。

使用数据卷容器可以让用户在容器之间自由的升级和移动数据卷。

3.1.利用数据卷容器来迁移数据

3.1.1.备份

docker run --volumes-from dbdata -v $(pwd):/backup --name worker ubuntu tar cvf /backup/backup.tar /dbdata

  

具体分析下这个命令:

首先利用ubuntu镜像穿件一个worker容器。使用--volumes-from dbdata参数来让worker容器挂载dbdata容器的数据卷,使用-v $(pwd):/backup参数来挂载本地的当前目录到worker容器的/backup目录。

worker容器启动后,使用tar cvf /backup/backup.tar /dbdata 命令将/dbdata内容备份为容器内的/backup/backup.tar,即宿主机当前目录下的backup.tar

3.2.1.恢复

首先创建一个带有数据卷的容器dbdata2

docker run -v /dbdata --name dbdata2 ubuntu /bin/bash

  

然后创建另一个新的容器,挂载dbdata2的容器,并使用untar解压备份文件到所挂载的容器卷中

docker run --volumes-from dbdata2 -v $(pwd):/backup busybox tar xvf /backup/backup.tar

  

4.1.小结

数据是宝贵的。即使容器出现问题,我们也可以通过数据卷和数据卷容器对容器内的数据进行共享、迁移、备份等,快速的恢复项目或程序的运行。

另外,在生产环境中,除了使用数据卷和数据卷容器之外,还可以定期对主机数据进行备份,或使用支持容错的存储系统,包括raid或分布式文件系统,如ceph,gpfs,hdfs等。

如果不希望将数据保存在宿主机或容器当中,还可以使用tmpfs类型的数据卷,其中数据只存在于内存中,容器退出后自动删除。

猜你喜欢

转载自www.cnblogs.com/xysr-tom/p/12540650.html