乐维监控 x Prometheus:解锁高效运维新技能
1389乐维监控对接Prometheus
View detailsSearch the whole station
这一期主要来跟大家聊一下,使用node_exporter工具来暴露主机和因公程序上的指标,利用prometheus来监控宿主机;以及通过通过Cadvisor监控docker容器。
# 1 下载软件包
wget https://github.com/prometheus/node_exporter/releases/download/v1.4.0/node_exporter-1.4.0.linux-amd64.tar.gz
# 创建node exporter运行目录
mkdir -p /usr/local/node_exporter
tar -xf node_exporter-1.4.0.linux-amd64.tar.gz
cd node_exporter-1.4.0.linux-amd64 && mv ./* /usr/local/node_exporter
#验证
./node_exporter --version
./node_expoter –help
#默认运行端口
–web.listen-address=”:9100″
# 暴露指标的路径
–web.telemetry-path=”/metrics”
#注意:通过配置参数,可以决定启用哪些收集器。
#启动node_exporter,可以指定参数进行覆盖
nohup ./node_exporter –web.listen-address=”:9600″
–web.telemetry-path=”/metrics” &
#查看是否启动完成 ps -ef | grep node_exporter
说明: textfile收集器允许我们暴露自定义指标,这些自定义指标可能是批处理或cron作业无法抓取的,或者是没有可用的exporter
原理:收集器通过扫描指定目录中的问津,提取所有格式为prometheus指标的字符串,然后暴露他们以便被prometheus sever抓取
1) 创建收集器目录
mkdir /usr/local/node_exporter/textfile_collector
2) 创建新指标,注意指标在以.prom结尾的文件内定义
echo ‘metadata{role=”docker”,data_center=”ShangHai”} 2’ >metadata.prom
3) 启动textfile收集器
textfile收集器不需要配置参数,默认就会被加载,我们在启动node_exporter的时候,指定textfile收集器的目录即可
参数:
collector.textfile.directory
启动
nohup ./node_exporter –web.listen-address=”:9600″ –web.telemetry-path=”/metrics” –collector.textfile.directory=”/usr/local/node_exporter/textfile_collector” &
说明: systemd收集器记录了systemd管理的服务,通过–collector.systemd.unit-whitelist参数指定需要收集的服务,按需收集
启动:
nohup ./node_exporter –web.listen-address=”:9600″ –web.telemetry-path=”/metrics” –collector.textfile.directory=”/usr/local/node_exporter/textfile_collector” –collector.systemd –collector.systemd.unit-whitelist=”(docker|sshd|rsyslog).service” &
配置prometheus对node_exporter进行指标采集
– job_name: “node_exporter”
static_configs:
– targets: [“192.168.161.118:9600”] #这个端口尽量使用默认端口9100,方便辨认
docker run
-v /:/rootfs:ro
-v /var/run:/var/run/:rw
-v /sys:/sys:ro
-v /dev/disk:/dev/disk:ro
-v /home/docker:/var/lib/docker:ro
-p 8080:8080
–detach=true –name=cadvisor –net=host google/cadvisor
#注意:/home/docker为实际部署的docker数据目录,默认应该为/var/lib/docker
验证:
查看指标:
http://192.168.161.118:8080/metrics
配置prometheus server抓取CAdvisor
配置prometheus.yml配置文件
热重启prometheus
#prometheus server启动开启热更新配置
参数:–web.enable-lifecycle
nohup ./prometheus –web.enable-lifecycle –config.file=prometheus.yml &
#热重启prometheus
curl -X POST http://192.168.161.118:9090/-/reload
查看prometheus 的targets,即可发现,docker容器监控完成,到此本期的分享就结束了,更多关于prometheus的干货分享,可以持续关注乐维社区,或者乐维官网的prometheus技术分享专栏。
这一期乐维君主要跟大家来探讨新一代的开源监控prometheus,我们知道 zabbix 在监控界占有不可撼动的地位,功能强大。但是对容器监控显得力不从心。为解决监...
View details通过Nginx反向代理是一个不错的选择。 本文乐维君将介绍通过Nginx反向代理增加401认证方式来实现加密登录。
View details前面几期乐维君已经跟大家介绍了prometheus的安装配置、告警规则等等,本期将重点介绍prometheus监控各个指标的含义、类型以及格式。
View details对于运维监控而言,除了监控展示以外,另一个重要的需求无疑就是告警了。良好的告警可以帮助运维人员及时的发现问题,处理问题并防范于未然,是运维工作中不...
View details