Docker使用之数据管理

在前面的博客中,讲解了Docker的基本命令和简单应用,如果忘记了可以去复习一下——Ubuntu下docker安装及简单应用。本篇文章主要对Docker中的数据管理进行讲解。

前言:当我们在实际的生产环境当中,需要对Docker中产生的数据进行持久化,或者当我们在多个容器之间共享数据时,这个中间就必然涉及到容器的数据管理操作。
在容器中管理数据主要有两种方式:

  • 数据卷(Data Volumes):容器内数据直接映射到本地主机环境。
  • 数据卷容器(Data Volumes Containers):使用特定容器维护数据卷。

下面将对数据卷和数据容器进行介绍,同时对数据备份和恢复进行讲解。

一、数据卷

一个数据卷就是经过特殊设计的,在一个或多个容器中通过UFS文件系统提供的一些特性 实现数据持久化或共享。

数据卷就是一个可以供容器使用的特殊的目录,它将主机操作系统目录直接映射进容器,类似Linux中的mount操作。

数据卷主要的特性如下:

  • 数据卷可以在容器之间共享和重用,使得容器间传递数据将变得高效方便
  • 对数据卷内数据的修改会立马生效,无论是容器内操作还是本地操作
  • 对数据卷的更新不会影响镜像,解耦了应用和数据
  • 卷会一直存在,直到没有容器使用,可以安全地卸载它

1、在容器内创建一个数据卷

在用docker run命令的时候,使用-v标记可以在容器内创建一个数据卷。多次重复使用-v标记可以创建多个数据卷。
下面使用ubuntu/web镜像创建一个web容器,并创建一个数据卷挂载到容器的/web目录:

docker run -d -P --name web -v /web ubuntu/web

-P是将容器服务暴露的端口,是自动映射到本地主机的临时端口。

2、挂载一个宿主机目录作为数据卷

使用-v标记也可以指定挂载一个本地的已有目录到容器中去作为数据卷(推荐方式)。

docker run -d -P --name web -v /web:/opt/web ubuntu/web

上面的命令将挂载宿主机的/web目录到容器的/opt/web目录上。

这个功能在进行测试的时候十分方便,比如用户可以将一些程序或数据放到本地目录中,然后在容器内运行和使用。另外,本地目录的路径必须是绝对路径,如果目录不存在,Docker会自动创建。

注意:

Docker挂载数据卷的默认权限是读写(rw),用户也可以通过ro指定为只读。

ro表示readonly,挂载后的数据卷就是只读权限了,如下:

docker run -d -P --name web -v /web:/opt/web:ro ubuntu/web

加了:ro之后,容器内对所挂载数据卷内的数据就无法修改了。

3、挂载一个本地主机文件作为数据卷

-v标记也可以从宿主机挂载单个文件到容器中作为数据卷(不推荐)。

docker run --rm -it -v ~/.bash_history:/.bash_history ubuntu /bin/bash

这样就可以记录在容器输入过的命令历史了。

注意:如果直接挂载一个文件到容器,使用文件编辑工具,包括vi或者sed–in-place的时候,可能会造成文件inode的改变,从Docker 1.1.0起,这会导致报错误信息。所以推荐的方式是直接挂载文件所在的目录。

二、数据卷容器

如果用户需要在多个容器之间共享一些持续更新的数据,最简单的方式是使用数据卷容器。数据卷容器也是一个容器,但是它的目的是专门用来提供数据卷供其他容器挂载。

首先,创建一个数据卷容器dbdata,并在其中创建一个数据卷挂载到/dbdata:

docker run -it -v /dbdata --name dbdata ubuntu

进入容器内部可以查看到/dbdata目录:
dbdata目录

然后,可以在其他容器中使用–volumes-from来挂载dbdata容器中的数据卷,例如创建db1和db2两个容器,并从dbdata容器挂载数据卷:

docker run -it --volumes-from dbdata --name db1 ubuntu
docker run -it --volumes-from dbdata --name db2 ubuntu

此时,容器db1和db2都挂载同一个数据卷到相同的/dbdata目录。三个容器任何一方在该目录下的写入,其他容器都可以看到。

比如我们在dbdata容器中创建一个test文件,如下所示:
test文件

在db1容器内查看它:
db1内文件

可以多次使用–volumes-from参数来从多个容器挂载多个数据卷。还可以从其他已经挂载了容器卷的容器来挂载数据卷。
比如:

docker run -it --name db3 --volumes-from db1 ubuntu

使用–volumes-from参数所挂载数据卷的容器自身并不需要保持在运行状态。

如果删除了挂载的容器(包括dbdata、db1和db2),数据卷并不会被自动删除。如果要删除一个数据卷,必须在删除最后一个还挂载着它的容器时显式使用docker rm -v命令来指定同时删除关联的容器。

当删除掉dbdata容器后,进入db1容器,依然可以查看到数据卷的数据。
删掉dbdata

进入db1容器

db1容器

三、利用数据卷容器来迁移数据

可以利用数据卷容器对其中的数据卷进行备份、恢复,以实现数据的迁移。下面分别介绍这两个操作。

1、备份

使用下面的命令来备份dbdata数据卷容器内的数据卷:

docker run --volumes-from dbdata -v $(pwd):/backup --name worker ubuntu tar cvf /backup/backup.tar /dbdata

首先利用ubuntu镜像创建了一个容器worker。使用–volumes-from dbdata参数来让worker容器挂载dbdata容器的数据卷(即dbdata数据卷),使用-v $(pwd):/backup参数来挂载本地的当前目录到worker容器的/backup目录。worker容器启动后,使用了tar cvf /backup/backup.tar /dbdata命令来将/dbdata下内容备份为容器内的/backup/backup.tar,即宿主主机当前目录下的backup.tar。

2、恢复

如果要将数据恢复到一个容器,可以按照下面的步骤操作。

首先创建一个带有数据卷的容器dbdata2:

$ docker run -v /dbdata –name dbdata2 ubuntu /bin/bash

然后创建另一个新的容器,挂载dbdata2的容器,并使用tar命令解压备份文件到所挂载的容器卷中:

docker run --volumes-from dbdata2 -v $(pwd):/backup --name worker ubuntu bash

进入数据挂载目录,

cd /dbdata

解压文件,

tar xvf /backup/backup.tar

到这里Docker的数据管理就到此结束了,最后再分析一个细节问题:
关于容器的互联机制:
容器的互联(linking)是一种让多个容器中应用进行快速交互的方式。它会在源和接收容器之间创建连接关系,接收容器可以通过容器名快速访问到源容器,而不用指定具体的IP地址。
容器的互联使用–link来让容器之间安全地进行交互。

–link参数的格式为–link name:alias,其中name是要连接的容器名称,alias是这个连接的别名。
比如,创建一个web容器,并将它连接到db容器:

docker run -d -P --name web --link db:db ubuntu/web 

此时,db容器和web容器建立互联关系。

这里需要区别一下,挂载数据卷和容器互联是不同的。

参考

  • 《Docker技术入门与实战 第2版》

猜你喜欢

转载自blog.csdn.net/anumbrella/article/details/80056853