Search the whole station

监控全面 业务精准 | 乐维智能监控平台V6.6正式发布

近日,乐维智能监控平台V6.6正式发布!

新版本在监控能力、业务服务、告警管理、知识库、网络拓扑、报表管理等方面进行较大地优化和改进,更新的重点包括:

1 优化对云平台、虚拟化及动环设备监控——监控能力更全面

2 智能业务拓扑全面上线——资源发现更智能,业务关系更精准

3 新增业务容量分析——为资源投入规划提供支撑

4 强化告警与知识联动——智能匹配关联知识,形成知识复用机制

5 新增告警抑制——避免产生告警风暴

6 优化知识库管理——权限管理更合理

7 优化网络拓扑——新增代理支持、编辑操作更灵活

8 新增多种报表——包括图形报表、主机性能报表、僵尸机报表

9 其他更新与优化

以下是具体更新情况:

01.优化对云平台、虚拟化及动环设备监控:

监控能力更全面

新版本优化对阿里云、腾讯云、华为云、深信服桌面云、麒麟云、亚马逊云等云平台的监控,同时对Vcenter、KVM、Citrix、CAS、NUTANIX、Fusion、K8s、Docker等虚拟化设施,以及海康威视、华为、施耐德、华咨圣泰、鑫芯物联、恩亿梯等动环设备的监控进行了优化。

02.智能业务拓扑全面上线:

资源发现更智能,业务关系更精准

业务稳定是运维的目的和结果,运维是实现业务稳定的手段。从业务出发,构建业务与运维的关系图谱,可以有效提高故障响应速度,提升排障效率,构建业务与运维的关系图谱一种实现方式就是乐维智能业务拓扑。

具体来说,乐维智能业务拓扑支持通过IP扫描出关联的服务端口和对端主机,实现业务资源、业务关系、应用进程、服务端口的自动发现及业务拓扑自动生成,形成资源关系的业务视角。

智能业务拓扑最大支持5层访问关系,通过拓扑图可了解业务资源关系、外部系统访问关系、服务端口调用关系等,为故障定位及故障影响范围分析提供支撑。

同时,智能业务拓扑还支持以下功能:

  • 引入业务资源、服务端口、指标分析、应用进程等多项表单及图表功能,便于从多维度对监控资源进行更全面的分析利用;
  • 自动识别未纳入监控对象,可手动添加监控操作;对于已监控对象,加入指标趋势图分析,可查看业务维度的指标趋势图,支持同轴分析;
  • 对于拓扑节点,新增Ping功能、终端登录功能;可将当前节点设为扫描起始点;支持排除IP、隐藏/查看下联节点等操作;
  • 新增业务拓扑自动同步,已监控对象可同步到业务树资源;
  • 新增告警快照功能,轮播展示当前拓扑的告警清单;
  • 支持切换拓扑布局为层级布局方式,调整图标布局;支持曲线的连线方式;
  • 新增”全局指标“功能,使用指标映射为数据源,支持配置对象指标和业务指标,应用为所有业务拓扑。

03.新增业务容量分析:

为资源规划提供支撑

为适应业务的发展、保障业务系统的稳定运行,企业需要合理规划与业务相匹配的资源投入,一方面避免投入不足给业务支撑不够,另一方面要避免投入的资源过多造成浪费,业务容量分析可以很好地解决这一问题。

乐维监控V6.6新增的业务容量分析功能,针对业务主机,可对主机容量、CPU使用率趋势、内存使用率趋势、CPU使用率最高top5、内存使用率最高top5、文件系统容量使用占比、文件系统容量使用率TOP5等进行监测和分析。

04.强化告警与知识联动:

自动匹配关联知识,形成知识利用机制

运维实践中存在着大量类似地、重复性的故障与告警,总结利用好过往的故障问题及其解决方案,形成有效地复用机制,就可以有效提高运维效率。

乐维监控V6.6新引入的智能告警能够自动匹配关联知识,告警产生后,系统将自动匹配和推送关联知识,为运维人员解决故障问题提供参考。

05.新增告警抑制:

避免产生告警风暴

当代运维监控系统对监控指标的监控粒度已经达到非常细微的程度,一方面实现了监控的全面性,另一方面也增加了告警风暴的风险;减少无效和不必要告警,成为当代运维监控的显性需求。

乐维监控V6.6新增告警通知抑制。当通知告警数达到风暴临界点时,可触发熔断保护机制,避免大规模告警发送;通知规则的配置还支持全局模板与个性化内容,分别满足普适性告警管理与特殊告警管理需求。

06.知识库管理优化:

权限管理更合理,支持分享、下载等

  • 知识内容支持对外分享,可配置无需登录鉴权;
  • 新增知识管理权限,知识创建者和超管可以进行编辑和删除操作;
  • 目录树权限调整,支持对目录树的内置分类进行编辑、删除操作;
  • 知识内容支持下载操作,可下载PDF或Word文档;
  • 个人知识管理优化,支持查看当前用户发布的所有知识,支持取消发布操作;支持对个人保存为草稿的所有知识,支持编辑、发布、删除操作;支持查看个人收藏的所有知识,支持批量取消;
  • 知识库接入企业微信应用,可在移动端进行知识的查询、分享、收藏等操作。

07.网络拓扑优化:

新增代理支持、编辑操作更灵活

乐维监控V6.6的网络拓扑自动发现新增代理支持,可设置全局代理、单独针对IP范围或IP的代理(代理数据源为自研的代理管理)。

同时,网络拓扑的编辑操作也更加灵活:

  • 支持框选多个拓扑节点后,批量移除节点;
  • 支持添加单个有效IP,可批量粘贴生成多个IP;
  • 拓扑连线上支持显示端口带宽,可在编辑拓扑中配置。

08.新增多种报表:

包括图形报表、主机性能报表、僵尸机报表

新版本新增图形报表与主机性能报表;多样性报表增加新成员——僵尸机器报表。

  • 图形报表支持查看监控对象3个月以内的趋势图展示;
  • 主机性能报表可针对操作系统、云主机的性能指标(CPU、内存)进行统计;
  • 通过鉴别僵尸机器、不跑业务主机自动生成的僵尸机器报表可为优化资源配置提供依据;

至此,乐维监控报表体系覆盖实时报表、TOPN报表、流量报表、日报周报、僵尸机器报表、图形报表、主机性能报表、自定义报表等,满足大多数运维场景需求;自主订阅、代理订阅,定时发送邮箱。

09.其他更新与优化:

更多功能细节

  • 优化告警与阈值配置流程

在告警详情页加入【阈值配置】入口,可快速跳转到阈值配置页面,打造告警流程管理闭环;新增【监控点】,默认查询前后一小时的数据,更有利于故障分析;

  • 优化知识生成入口及知识创建流程

告警与知识创建形成强关联,便于工程师在处理告警的过程中进行知识互动;此外,知识创建还新增Markdown编辑方式,展现内容更丰富。

  • 新增网络设备连通性测试

乐维监控V6.6新引入网络设备连通性测试。添加网络设备时,可通过SNMP进行连通性测试。

  • 新增代理终端登录与PING功能

监控对象新增代理终端登录与PING功能,支持操作系统、数据库、网络设备、服务器、云平台、容器等资源类型。

乐维社区已经开放免费版下载,欢迎大家下载体验乐维监控免费版

The prev: The next:

Related recommendations

Expand more!