案例分享 | 某券商案例落地效果评估

​文章来自公众号——布博士(擎创科技资深产品专家)

前言:

利用AI算法进行告警关联分析,在AIOps行业内沸沸扬扬的热了好久。在之前的文章中我也介绍了某券商案例,这个案例目前已经实际落地并运行了一段时间,所以本次分享我想就该案例得落地效果做一个简单的分析反馈。

如果还未阅读过前文内容,点击下图,一键了解。感兴趣的朋友可以先马住,以防迷路↓↓↓

案例分享 | 某券商利用AI技术进行告警关联分析(上)

案例分享 | 某券商利用AI技术进行告警关联分析(下)

一、案例落地效果评估

本项目目标是对该券商客户的“核心业务系统”在过去6个月内产生的33.6万条历史告警数据进行关联分析。通过5轮迭代,我们最终得到了22条关联模式结果,并由数据科学家筛选出了13条有效结果提交给客户方的运维专家评审。客户方对我们的工作给出了以下反馈:

  • 提交的评审记录大部分基本满足了预期

  • 已指示现场项目组同学开始投产

分析结果的全部22条告警关联模式结果如下图所示

​上图中的”600000116”这些数字代表的是告警辨析中心中告警内容模板ID,在对该券商的数据集进行分析时,我们发现大量告警的指标为空值,因此我们在后续的告警关联分析挖掘中采用template_id(告警内容模板ID,这是告警辨析产品独有的一个能力)。

挖掘结果内容包括premise - 前驱节点、conclusion - 后继节点、support - 支持度、confidence - 置信度、lift - 提升度信息。

在实际落地中,下面一个组合,{600000116,6000001494,600000906}是告警辨析产品对告警内容进行归纳之后,生成的告警关联模式评审结果页,在评审阶段需要转换为如下的模板信息以及告警时段的告警列表,才能够有效协助运维专家对告警关联分析结果进行有效评审。

如下图产品产出之结果的评审界面所示:

二、案例总结

融入内置算法的告警辨析中心(UniAlertNEX)产品最大的优势是在针对历史告警能够智能地找到我们所需要的模式。在数据科学家和客户对这些结果评审之后,我们就可以将这些结果应用于告警关联场景中,每次捕获这种关联场景时,就会生成关联告警,在实际运用中解决了用户相当多的实际问题,如下。

1.分层降噪:通过将原子化压缩的告警关联到一起,进一步降低运维人员要处理的告警量。

2.信息分类治理:在数据中心中一旦各种告警来到告警工作台,各种告警信息便纷沓而至,将使运维工程师处在混乱中,通过挖掘告警关联模式可以将无序的告警按不同的问题进行分类管理。

3.完善告警上下文:将多个相关联的告警放到一起进行处理,为告警的处理过程提供了更完善的上下文信息,便于进行因果 关系分析。

4.减少告警处理量:将多个相关联的告警放到一起进行处理,进一步降低了要处理的告警量。优化加速排障:通过对告警的关联分析,可以加速排障的过程。


擎创科技,Gartner连续推荐的AIOps领域标杆供应商。公司致力于协助企业客户提升对运维数据的洞见能力,优化运维效率,充分体现科技运维对业务运营的影响力。

行业龙头客户的共同选择

更多运维思路与案例持续更新中,敬请期待

随手点关注,更新不迷路

猜你喜欢

转载自blog.csdn.net/qq_37641528/article/details/129706229