docker_监控

目录

Docker 自带的监控子命令

ps

docker container ps查看当前运行的容器。

新版的 Docker 提供了一个新命令 docker container ls,其作用和用法与 docker container ps 完全一样。不过 ls 含义可能比 ps 更准确

top

执行 docker container top [container] 命令,查看容器运行了哪些进程

stats

docker container stats 用于显示每个容器各种资源的使用情况。

sysdig

sysdig 是一个轻量级的系统监控工具,同时它还原生支持容器。通过 sysdig 我们可以近距离观察 linux 操作系统和容器的行为。

安装和运行 sysdig 的最简单方法是运行 Docker 容器,命令行为:

docker container run -it --rm --name=sysdig --privileged=true
​ --volume=/var/run/docker.sock:/host/var/run/docker.sock
​ --volume=/dev:/host/dev
​ --volume=/proc:/host/proc:ro
​ --volume=/boot:/host/boot:ro
​ --volume=/lib/modules:/host/lib/modules:ro
​ --volume=/usr:/host/usr:ro
​ sysdig/sysdig

sysdig 容器是以 privileged方式运行,而且会读取操作系统 /dev/proc 等数据

通过 docker container exec -it sysdig bash 进入容器,执行 csysdig 命令,将以交互方式启动 sysdig

这是一个类似 linux top 命令的界面。sysdig 按不同的 View 来监控不同类型的资源,点击底部 Views 菜单(或者按 F2),显示 View 选择列表

回车或者双击 Containers,进入容器监控界面。

sysdig 会显示该 Host 所有容器的实时数据,每两秒刷新一次。各列数据的含义也是自解释的,如果不清楚,可以点一下底部 Legend(或者按 F7)。如果想按某一列排序,比如按使用的内存量,很简单,点一下列头 VIRT

如果想看某个容器运行的进程,比如 weave将光标移到目标容器,然后回车或者双击。

还可以继续双击查看进程中的线程。

返回上一级,按退格键即可。

点击底部 Search菜单,然后输入关键字可以进行查找。如下图,关键字为 service

点击底部 Pause 菜单,暂停页面刷新。

sysdig 的特点如下:

  1. 监控信息全,包括 Linux 操作系统和容器。
  2. 界面交互性强。

sysdig 显示的是实时数据,看不到变化和趋势。而且是命令行操作方式,需要 ssh 到 Host 上执行,会带来一些不便。

Weave Scope

Weave Scope 的最大特点是会自动生成一张 Docker 容器地图,让我们能够直观地理解、监控和控制容器。如图

安装

执行如下脚本安装运行 Weave Scope。

curl -L git.io/scope -o /usr/local/bin/scope

chmod a+x /usr/local/bin/scope

scope launch

scope launch 将以容器方式启动 Weave Scope。

容器监控

Weave Scope 地图中间显示了 Host 当前运行的容器,不过少了几个 weave 相关的容器。

Weave Scope 将容器分为两类:Weave 自己的容器 System Container,和其他容器 Application Container,默认只显示后者。

Weave Scope 界面是一个可交互的地图,使用起来很方便。比如点击地图左下角选择开关 All

点击 CPU 选择器。将鼠标放到容器图标上,则会显示具体的 CPU%。

如果要查看容器的详细信息,比如bbox1,可以点击该容器的图标。

详细信息包括这么几部分:

Status

CPU、内存的实时使用情况以及历史曲线。

INFO

容器 image、启动命令、状态、网络等信息。

PROCESSES

容器中运行的进程。

ENVIRONMENT VARIABLES

环境变量。

DOCKER LABELS

容器启动命令。

IMAGE

镜像详细信息。

在容器信息的上面还有一排操作按钮。

Weave Scope 多主机监控

点击顶部 HOSTS 菜单项,地图将显示当前 host。

host 当前的资源使用情况和历史曲线一览无余。除此之外也能很方便地查看 host 上运行的进程和容器列表,点击容器名字还可以打开此容器的信息页面。

host 页面上部有一个按钮,点击可直接打开 host 的 shell 窗口

多主机监控

两个 Docker Host:

node3: 192.168.56.180.5
node2: 192.168.56.180.4

在两个 host 上都执行如下命令:

scope launch 192.168.180.5 192.168.180.4

点击 CONTAINERS 菜单项,将显示部署环境中所有的容器。

cAdvisor

在 host 中运行 cAdvisor 容器。

docker run
--volume=/:/rootfs:ro
--volume=/var/run:/var/run:rw
--volume=/sys:/sys:ro
--volume=/var/lib/docker/:/var/lib/docker:ro
--publish=8080:8080
--detach=true
--name=cadvisor
google/cadvisor:latest

监控 Docker Host

cAdvisor 会显示当前 host 的资源使用情况,包括 CPU、内存、网络、文件系统等。


监控容器

点击 Docker Containers 链接。

点击容器可以进入容器里查看,容器的信息

cAdvisor 的主要功能主要两点:

  1. 展示 Host 和容器两个层次的监控数据。
  2. 展示历史变化数据。

由于 cAdvisor 提供的操作界面略显简陋,而且需要在不同页面之间跳转,并且只能监控一个 host,这不免会让人质疑它的实用性。但 cAdvisor 的一个亮点是它可以将监控到的数据导出给第三方工具,由这些工具进一步加工处理。

可以把 cAdvisor 定位为一个监控数据收集器,收集和导出数据是它的强项,而非展示数据。

Prometheus

Prometheus 是一个非常优秀的监控工具。准确的说,应该是监控方案。Prometheus 提供了监控数据搜集、存储、处理、可视化和告警一套完整的解决方案。

Prometheus 的架构

Prometheus Server

Prometheus Server 负责从 Exporter 拉取和存储监控数据,并提供一套灵活的查询语言(PromQL)供用户使用。

Exporter

Exporter 负责收集目标对象(host, container…)的性能数据,并通过 HTTP 接口供 Prometheus Server 获取。

可视化组件

监控数据的可视化展现对于监控方案至关重要。以前 Prometheus 自己开发了一套工具,不过后来废弃了,因为开源社区出现了更为优秀的产品 Grafana。Grafana 能够与 Prometheus 无缝集成,提供完美的数据展示能力。

Alertmanager

用户可以定义基于监控数据的告警规则,规则会触发告警。一旦 Alermanager 收到告警,会通过预定义的方式发出告警通知。支持的方式包括 Email、PagerDuty、Webhook 等.

多维数据模型

  1. 通过维度对数据进行说明,附加更多的业务信息,进而满足不同业务的需求。同时维度是可以动态添加的,比如再给数据加上一个 user 维度,就可以按用户来统计容器内存使用量了。

  2. Prometheus 丰富的查询语言能够灵活、充分地挖掘数据的价值。前面示例中的 avg、sum、by 只是查询语言中很小的一部分功能,已经为我们展现了 Prometheus 对多维数据进行分片、聚合的强大能力。

    部署

    环境说明

    通过 Prometheus 监控两台 Docker Host:192.168.180.4 和 192.168.180.5,监控 host 和容器两个层次的数据。

    按照架构图,运行如下组件:

    Prometheus Server

    Prometheus Server 本身也将以容器的方式运行在 host 192.168.180.5 上。

    Exporter

    Prometheus 有很多现成的 Exporter,完整列表请参考 https://prometheus.io/docs/instrumenting/exporters/

    本次实验使用:

    1. Node Exporter,负责收集 host 硬件和操作系统数据。它将以容器方式运行在所有 host 上。
    2. cAdvisor,负责收集容器数据。它将以容器方式运行在所有 host 上。

    Grafana

    显示多维数据,Grafana 本身也将以容器方式运行在 host 192.168.56.103 上。

    运行 Node Exporter

    在两个 host 上执行如下命令:

docker run -d -p 9100:9100 -v "/proc:/host/proc" -v "/sys:/host/sys" -v "/:/rootfs" --net=host prom/node-exporter --path.procfs /host/proc --path.sysfs /host/sys --collector.filesystem.ignored-mount-points "^/(sys|proc|dev|host|etc)($|/)"

注意,使用--net=host,这样 Prometheus Server 可以直接与 Node Exporter 通信。

Node Exporter 启动后,将通过 9100 提供 host 的监控数据。在浏览器中通过 http://192.168.180.4:9100/metrics 测试一下。

##### 运行 cAdvisor

在两个 host 上执行如下命令:

docker run --volume=/:/rootfs:ro --volume=/var/run:/var/run:rw --volume=/sys:/sys:ro --volume=/var/lib/docker/:/var/lib/docker:ro --publish=8080:8080 --detach=true --name=cadvisor --net=host google/cadvisor:latest

##### 运行 Prometheus Server

在 host 192.168.56.103 上执行如下命令:

docker run -d -p 9090:9090 -v /root/prometheus.yml:/etc/prometheus/prometheus.yml --name prometheus --net=host prom/prometheus

prometheus.yml 是 Prometheus Server 的配置文件

最重要的配置是:

static_configs:
- targets: ['localhost:9090','localhost:8080','localhost:9100','192.168.56.180.5:9090','192.168.180.4:9100']

指定从哪些 exporter 抓取数据。这里指定了两台 host 上的 Node Exporter 和 cAdvisor。

另外 localhost:9090 就是 Prometheus Server 自己,可见 Prometheus 本身也会收集自己的监控数据。同样地,可以通过 http://192.168.180.5:9090/metrics 测试一下。

在浏览器中打开 http://192.168.180.5:9090 ,点击菜单 Status -> Targets

TargetState 都是 UP,说明 Prometheus Server 能够正常获取监控数据。

运行 Grafana

在 host 192.168.56.103 上执行如下命令:

[top]
docker run -d -i -p 3000:3000 -e "GF_SERVER_ROOT_URL=http://grafana.server.name" -e "GF_SECURITY_ADMIN_PASSWORD=secret" --net=host grafana/grafana

注意,这里我们使用了 --net=host,这样 Grafana 可以直接与 Prometheus Server 通信

-e "GF_SECURITY_ADMIN_PASSWORD=secret 指定了 Grafana admin用户密码 secret

Grafana 启动后。在浏览器中打开 http://192.168.180.5:3000/

配置

然后就可以展示数据

猜你喜欢

转载自www.cnblogs.com/mrwuzs/p/9751189.html