[社群QA] Zabbix“专家坐诊”第91期问答汇总

[复制链接]
乐维 发表于 2020-12-31 11:51:24 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
Q:通过snmp trap类型的监控项,其他数据正常,但是在最新数据里没有值,求教一下该怎么处理?
1.jpg
A:其他数据正常是指非traps的监控项的数据吗?
Q:对,其他的都是snmp agent类型的
A:确认设备是否有trap告警产生,只有设备产生并向采集服务器发出了traps信息,监控设备这边才会产生trap的数据
Q:有告警产生
2.jpg
A:网络设备这边,配置snmptrap指向zabbix采集服务器的IP,看看是不是配置正确的,然后看看zabbixServer的配置文件zabbix_server.conf,确认有启用参数StartSNMPTrapper=1
Q:这条设置了
A:建议你在zabbix服务器这边抓包看一下162端口有没有收到设备发来的日志
Q:好的,谢谢

Q:请问一下,如果主机上有某个文件,主机关机重启就不报警应该怎么弄?
A:依靠某个日志文件,去判断主机是否关机重启的意思?
Q:就是一个普通文件,在root用户的家目录下搞个文件FailMark,如果这台机器上有这个文件,机器关机重启就不报警,这个文件自己创建的A:加个这个文件存在判断的监控项,再关联那个系统启动时间的监控项,做成一个触发器,当两个条件同时成立就触发告警
3.jpg
Q:file需要写路径吗?
4.jpg
A:是的,完整路径
Q:是这样吗,专家大哥
5.jpg
然后这样
6.jpg
A:建议用
7.jpg
这个system.uptime监控项对比两次取值大小去判断是否重启Q:这个system uptime咋用的呀,后一个值小于前一个值就是重启了?
A:一般这个值突然变小了基本就是可以确定机器有重启过了
Q:那这个判断不了关机吧
A:关机的情况,agentd也采集不到数据了,只能通过触发器的nodata表达式判断了
Q:哦哦,那我直接用nodata了,反正重启也得几分钟,这个报错咋整
9.jpg
A:监控项那边的vfs.file.exists有报错吗?
Q:没,触发器报错,我用判断文件存不存在的脚本行不,存在就输出1,不存在就输出0
A:你可以试试看,跟这个判断的原理应该差不多的,这个触发器报错应该是说vfs.file.exists的监控项没采集到数据,或者你去最新数据看看这个监控项有没有正常取值
Q:这怎么一个值没有。。。
10.jpg
A:看看现在又报错没有?
11.png
Q:还是报错
12.jpg
13.jpg
A:这个主机的监控项都没有数据,可能要看看你agentd上的日志去判断下了
Q:这个是server出啥问题了吗?这个地址是server地址,好像是都没数据
14.png
A:再看下server的日志?
Q:上不去server,就给我这么一台测试机
A:telnet server的10051端口看能不能通
Q:下载不了Telnet,连不上了,估计server出问题了
15.jpg
A:nc -zvn file:///C:\Users\Tony\AppData\Roaming\Tencent\QQTempSys\%W@GJ$ACOF(TYDYECOKVDYB.png172.20.201.9 10051,看看有没有被拒绝的字样,感觉上是网络问题
Q:刚刚问了,网络在整改,我自己搞的虚拟机测试完全没问题
A:那这个触发器就是可行的,在刚刚那个机器上报错的提示是说对应的监控项没有数据而已
Q:专家大哥,我发现一个问题,这里是普通用户的时候也是不得行?
16.jpg
A:是的,动作是需要超管权限触发的
Q:记下了,谢谢专家大哥


Q:为什么我zabbix添加钉钉告警,有的时候能收到有的时候收不到?有配置文档吗?
A:钉钉告警可以参考下这篇文章http://www.lwops.cn/forum.php?mod=viewthread&tid=395钉钉告警收不到的时候,可以看一下zabbix这边的动作日志这边有没有发送失败的报错,如果没有发送失败的记录,那很大可能是钉钉接口调用的问题
Q:及时雨啊,刚好在做,zabbix告警我还推送到了电话告警平台,关键是当告警产生电话收到了告警, 但是钉钉没收到,电话每次都收到了,但是钉钉有时能收到,有时收不到

Q:请教一下zabbix mysql表分区
A:可以参考http://www.lwops.cn/forum.php?mo ... =%E5%88%86%E5%8C%BA

Q:[root@localhost ~]# systemctl start  zabbix-server.service
Job for zabbix-server.service failed because the control process exited with error code.
See "systemctl status zabbix-server.service" and "journalctl -xe" for details.
按装后,无法启动

8.jpg
这个目录没有文件
[root@localhost ~]# cd  /var/log/zabbix/
[root@localhost zabbix]# ll
总用量 4
-rw-rw-r--. 1 zabbix zabbix 3154 12月 30 03:46 zabbix_agentd.log

A:systemctl status zabbix-server.service -l看看报错详情
Q:我把selinux 关了就可以了,感谢各位大神

讲座91.png





上一篇:Suse获取磁盘利用率最大值
下一篇:linux用户与权限使用方法
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关注0

粉丝0

帖子366

发布主题
最新发布

乐维社区

微信公众号

版权所有 © 2016-2021 九一乐维丨粤ICP备17007026号