华为立体运维-第二课(AOM告警与通知)

一告警列表
告警界面提供告警统计信息及告警详情查询和告警清除功能。
告警查询:支持自定义时间段,自定义关键字及按级别筛选功能。
全局告警灯:在AOM所有界面都会显示,鼠标选中弹出最近X条告警信息列表,单击可跳转到告警界面,用于提示当前系统是否有告警产生。
告警清除:活动告警如果没有被清除,会一直被统计和查询到,清除后将不再显示。

二事件列表 
事件列表与告警列表功能类似,区别是事件没有级别且不需要清除。

三告警订阅
使用场景:
当用户需要将告警转发到第三方系统中时,可以使用AOM的告警订阅功能将数据转发到DMS的kafka队列中去,这种场景下,AOM作为生产者,第三方系统作为消费者从kakfa中消费数据
约束:告警订阅当前仅支持阈值告警的订阅,未来将支持更多类型告警

四阈值规则
是指当通过指标数据周期性的对设计好的值与当前指标值进行比较,如果满足规则条件,那么将执行规则定义的动作。
一条阈值规则由两部分组成:阈值模版+所应用到的资源
阈值规则包括:1静态阈值规则 2智能阈值规则
阈值规则创建方式:一键创建默认阈值 2单条创建3 批量创建

单条阈值规则创建
选中一个指标,输入阈值产生条件,选择阈值触发后的动作即可完成阈值规则创建。
在创建过程中,AOM提供阈值预览功能估用户对比当前值与阈值的数据,提供参考帮助用户设置合理的阈值。

批量阈值创建:
批量静态阈值创建需要首先创建静态阈值模板,也可以选择已有的模板进行创建。
 静态阈值模板中需要用户定义资源类型,指标名称及阈值计算条件和满足条件后的action。当模板应用到具体的资源上时,系统会将模板转为具体的一条规则并开始阈值计算。
模板功能适于大量的规则配置场景,如有100个节点需要创建CPU使用率的阈值,那么通过主机类型的模板,可以一次创建完成。

批量阈值创建:
注意事项:
应用到所有主机表示将阈值模板应用于当前所有的主机并应用于未来新加入的主机上。
如果选择资源树下具体的主机资源或者集群资源时,将只应用到已选择的资源上,新加入的资源,不会自动加入阈值规则关联的资源中去。

五通知管理

通知规则支持用户将告警以短信或者邮件的形式发送到指定的用户
其中短信和邮件的发送使用了云SMN服务,有免费使用额度,但超出会产生相应的费用。

猜你喜欢

转载自blog.csdn.net/xsjzdrxsjzdr/article/details/84678321