通用告警如何根据机器所属的业务组发送给对应的业务组的团队

Viewed 18

业务场景

比如有100台机器,分别归属于10个业务组,每个业务组只有一个团队进行维护管理
我配置了一个磁盘使用率大于80%的告警, 我希望只配置一次(比如扔到global这个业务组下),然后机器出现报警的时候,自动根据报警机器所归属的业务组发送报警给业务组对应的团队

考虑:

  1. 目前不太想把告警分别克隆到所有业务组, 这个工作量比较大,并且非常不灵活,万一调整了报警规则, 则所有业务团队都要改一遍
  2. 如果走告警订阅,则每一个业务组的人都要走一遍这个订阅步骤,并且这种通用告警策略是很多的, 以ecs为例子至少有20几条, 用户需要将这20几条都订阅(点20+次订阅按钮)

不知道有没有其他更好的方式

考虑了一下,还有一个办法, 给指标加一个alert_group label,对于不能加指标的,通过告警的时候追加标签的时候实现这个指标。这样在订阅告警的时候,一个业务组只需要订阅来自于global中标签alert_group=自己组 的告警即可

其实想了一下, 还有一个方案,就是对接类似于flashduty 这种三方告警平台,只需要将业务组和告警接收人配置一次,后续就不用管了,但这个方式公司策略不一定接受。。。

测试了一下,发现这个方式应该是改动最低,逻辑也是最简单的

0 Answers