[社群活动] Zabbix“专家坐诊”第97期问答汇总

[复制链接]
乐维 发表于 2021-2-25 14:29:18 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
Q:队列平均在1700左右这正常吗?
1.png
A:你要分析下队列的时间有多久、有哪些监控主机队列比较多的,然后排查下原因

Q:我把客户机上的agent服务停止了,配置的是主动模式,zabbix服务器为什么没有告警呀?
A:你先看下触发器是怎么配置的
Q:想问下当客户机断网了,或者agent服务没启动,再或者客户机关机了,突然提醒我,我该怎么配置监控项?
A:单独配置一个监控项做关机、断网的判断并不是很准确,建议结合其他监控项一起判断。例如:可以结合agent的ping、uptime、端口等一起判断
Q:是这两个对吧?
2.png
A:是的,建议把这2个监控项改为被动方式的会比较好
Q:被监控端和服务器都在外网,被动也可以?
A:agent端口互通就可以
Q:如果agent真的是每秒钟发送数据给服务器,那这样请求也太频繁了,以后客户机多了,服务器会不会承受不了?怎么设置agent数据发送的时间间隔?比如:我想每隔5s钟发送一次,而且agent发送频率太高,也会占用客户机的资源吧
A:一般来说,通常是设置60s,根据实际情况定;如果网络带宽、服务器配置很好的话可以设置30s以内
Q:是修改agent配置文件的这个吗?
A:是监控项的更新间隔

3

3
Q:我把agent服务停,这两个监控项也没有什么变化,这样触发器也不起作用对吧?
A:是的,采集时间没更新,正常应该是更新间隔的时间,应该是没数据的才对
Q:那我该如何修改触发器,在这种情况下,就推送告警?

4

4
A:我们一般是改成在多少时间内是没有数据的;这里是5分钟agent,ping这个键值是表示没有接收到数据的意思

5

5
Q:这个是系统自带的,我没修改过

6

6
A:可能是没有给这个宏配置timeout的时间

Q:我这有个snmptrap存储的,在zabbix web已经能看到数据了,但是这个监控项和触发器怎么写,能给个模板吗
A:你这些数据是怎么来的?
Q:在zabbix上配置了个snmptrap的模板,创建一个主机链接模板,在存储端发送一个告警,zabbix就能看到了
A:snmptrap告警挺多的,必须要根据trap oid配置不同的监控项,才能配置针对具体是什么trap告警

Q:像这种日志关键字报警动作为什么执行不了呢,有时候可以,有时候不行的

7

7
A:你可以对比下报警和不报警是不是哪里没写好?
Q:是同一个触发器,有时候可以正常报警,有时候无法执行报警,动作就是把这个触发器放进去发邮件,没啥了

8

8
A:不告警的动作日志那边有提示记录吗?
Q:没有,我重启过server,agent,重建过监控项,触发器,动作,这个日志报警都是这样
A:感觉格式写的不对劲,可以参考下官网关于logrt的说明调整下;

Q:请教一个触发器的问题,如果我在3分钟之内得到3次为1的值就触发报警,是用count去做还是其他的,有示例看看吗?
A:可以试下avg或者last,如下图的配置

9

9

10

10
讲座(1).png





上一篇:Zabbix“专家坐诊”第96期问答汇总
下一篇:Zabbix“专家坐诊”第98期问答汇总
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关注0

粉丝0

帖子327

发布主题
最新发布

乐维社区

微信公众号

版权所有 © 2016-2021 九一乐维丨粤ICP备17007026号