Docker监控与开源工具实战:从基础到大型环境

   日期:2024-12-26    作者:dm8cp 移动:http://ljhr2012.riyuangf.com/mobile/quote/50332.html

     当docker的坏境规模逐步变大后,我们的监控也就越来越重要了。

docker自带了监控命令:ps、top、stats等,还有几个开源的监控工具sysdig、weave、scope、cAdvisor和pormetheus。

一、docker自带的监控命令

 1、ps

       docker ps这个命令应该很熟悉了,可以看到容器当前的一个运行状态。它和docker container ls的命令用法一致。

docker# docker ps

  2、top

如果想知道容器里面都运行了哪些进程,可以执行docker container top [container] [options]

docker# docker container top test1

docker# docker container top test7 -aux

 3、stats

可以用来显示每个容器各种资源的使用情况

docker# docker container stats test7

默认显示的是一个实时变化的内容,如果容器没有做资源限制,那么显示的是host的总cpu、mem。他的缺点就是不能显示容器的名字,只能显示CONTAINER ID。

 

二、开源小型监控工具。

1、sysdig

   它是一个轻量级的系统监控工具,将strace、tcpdump、htop、iftop...这些监控工具的功能集成到一起。具体安装与使用如下

(1)下载监控容器

docker# docker search sysdig

docker# docker pull sysdig/sysdig

(2)启动并进入容器,给一个真正的root权限,并把host上一些关键的数据目录挂载到容器中

docker# docker container run -it --name sysdig --privileged=true
> -v /var/run/docker.sock:/host/var/run/docker.sock
> -v /dev:/host/dev
> -v /proc:/host/proc:ro
> -v /boot:/host/boot:ro
> -v /lib/modules:/host/lib/modules:ro
> -v /usr:/host/usr:ro
> sysdig/sysdig

这是一个类似linux中top的界面,但是功能强大了太多,按下F2,在左侧会有很多列表,选择containers,来监控我们host上的容器,或者F7查看帮助

 

2、Weave Scope

它的特点是自动生成一张docker容器地图,我们可以更加直观的来查看容器的运行情况,安装使用步骤如下

(1)下载Weave Scope并安装

docker# curl -L git.io/scope -o /usr/local/bin/scope

docker# scope launch               #会自己启动

(2)通过http://hostiphttp://hostip:4040来访问监控界面

(3)容器监控

WeaveScope地图中间显示了Host当前运行的容器,不过少了几个weave相关的容器。 Weave Scope 将容器分为两类: Weave自己的容器System Container,和其他容器Application Container,默认只显示后者。Weave Scope 界面是一个可交互的地图,使用起来很方便。比如点击地图左下角选择开关 AIl,
地图上会立刻会显示出所有的容器
点击 CPU 选择器。
 Weave Scope 将以高低水位方式显示容器CPU 使用量
如果此时我们将鼠标放到容器图标上,则会显示具体的CPU%。
如果要查看容器的详细信息,比如sysdig,可以点击该容器的图标。
详细信息包括这么几部分:Status CPU、内存的实时使用情况以及历史曲线。INFO 容器 image、启动命令、状态、网络等信息。以下几项需拉动滚动条查看。
 PROCESSES容器中运行的进程。ENVIRONMENT VARIABLES 环境变量,DOCKER LABELS 容器启动命令。IMAGE 镜像详细信息。在容器信息的上面还有一排操作按钮。
分别是:
 attach到容器启动进程,相当于执行 docker container attach
打开shell,相当于执行 docker container exec
重启容器,相当于执行 docker container restart
暂停容器,相当于执行 docker container pause
关闭容器,相当于执行 docker container stop
这排按钮使我们能够远程控制容器,相当方便。

 

三、适应大型环境的监控。

实验环境:两台docker服务器  192.168.0.125   192.168.0.126

 cAdvisor:负责收集容器数据,以容器方式运行在所有host上

node exporter:负责收集host硬件和操作系统的数据以容器方式运行在所有host上

prometheus server:接收所有数据

grafana:把prometheus收集的数据以多维数据显示出来,和prometheus一起运行下一台host上

实验步骤

1、下载安装cAdvisor

docker# docker search cadvisor

docker# docker pull google/cadvisor

docker# docker run -dit --name vadvisor -p 8080:8080
> -v /:/rootfs:ro
> -v /var/run:/var/run:rw
> -v /sys:/sys:ro
> -v /var/lib/docker/:/var/lib/dockerLro
> google/cadvisor

2、监控host,显示当前host的资源使用情况,包括CPU、内存、网络、文件系统等

在浏览器中输入http://192.168.0.125:8080

监控容器

 

监控容器
点击 Docker Containers 链接。
显示容器列表
点击某个容器,比如sysdig,进入该容器的监控页面。
以上就是cAdvisor的主要功能,总结起来主要两点:
1.展示Host 和容器两个展次的监控数据。
2.展示历史变化数据。

 cAdvisor的一个亮点是它可以将监控到的数据导出给第三方工具,由这此工具进一步加工处理我们可以把cAdvisor定位为一个监控数据收集器,收集和导出数据是它的强项,而非展示数据

 Prometheus 架构
 Prometheus是一个非常优秀的监控工具。准确的说,应该是监控方案。Prometheus 提供了监控数据搜集、存储、处理、可视化和告警一套完整的解决方案。让我们先来看看Prometheus 的架构。架构

 2、下载node-exporter,在所有host上运行

docker# docker search node-exporter

docker# docker pull prom/node-exporter

docker# docker run -d -p 9100:9100 
 -v "/proc:/host/proc
 -v "/sys:/host/sys
 -v "/:/rootfs
 --net=host 
 prom/node-exporter 
 --path.procfs /host/proc 
 --path.sysfs /host/sys 
 --collector.filesystem.ignored-mount-points "^/(sys|proc|dev|host|etc|rootfs/var/lib/docker/containers|rootfs/var/lib/docker/overlay2|rootfs/run/docker/netns|rootfs/var/lib/docker/devicemapper|rootfs/var/lib/docker/aufs)($$|/)"

在浏览器中输入http://192.168.0.125:9100/metrics

 http://192.168.0.126:9100/metrics

3、在host192.168.0.125上面下载运行prometheus server并配置

docker# docker search prometheus

docker# docker pull prom/prometheus

docker# docker run -dit --name prometheus --network host -p 9090:9090 -v /data/prometheus.yml:/etc/prometheus/prometheus.yml prom/prometheus

/data/prometheus.yml的内容为

# my global config
global:
  scrape_interval:     15s # Set the scrape interval to every 15 seconds. Default is every 1 minute.
  evaluation_interval: 15s # Evaluate rules every 15 seconds. The default is every 1 minute.
  # scrape_timeout is set to the global default (10s).

# Alertmanager configuration
alerting:
  alertmanagers:
  - static_configs:
    - targets:
      # - alertmanager:9093

# Load rules once and periodically evaluate them according to the global 'evaluation_interval'.
rule_files:
  # - "first_rules.yml"
  # - "second_rules.yml"

# A scrape configuration containing exactly one endpoint to scrape:
# Here it's Prometheus itself.
scrape_configs:
  # The job name is added as a label `job=<job_name>` to any timeseries scraped from this config.
  - job_name: 'prometheus'

    # metrics_path defaults to '/metrics'
    # scheme defaults to 'http'.

    static_configs:
    - targets: ['localhost:9090','localhost:9100','localhost:8080','192.168.0.126:8080','192.168.0.126:9100']

在浏览器中输入http://http://192.168.0.125:9090s测试一下

 

4、在host192.168.0.125上下载运行grafana

docker# docker search grafana

docker# docker pull grafana/grafana

docker# docker run -dit -p 3000:3000 --network host 

 --name grafana 

 -e "GF_SERVER_ROOT_URL=http://grafana.server.name

 -e "GF_SECURITY_ADMIN_PASSWORD=123

 grafana/grafana

在浏览器中输入http://192.168.0.125:3000, 使用我们的用户和密码登录,admin  123

(1)点击DATA SOURCE,我这是已经创建好了

(2)选择prometheus

(3)输入名称,和prometheus的ip、端口,再点击保存,就创建成功了

(4)创建仪表盘

我们先到https://grafana.com/grafana/dashboards/11558点击Download JSON下载一个模板

在导入就行了

 

 


特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。


举报收藏 0评论 0
0相关评论
相关最新动态
推荐最新动态
点击排行
{
网站首页  |  关于我们  |  联系方式  |  使用协议  |  隐私政策  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号