有没有什么办法在机器失联告警中,去掉中心端的n9e掉线的情况呢

Viewed 27

n9e版本: v6.6.1 categraf版本:v0.3.40
问题:中心端的n9e服务挂了,待恢复后所有机器触发失联的告警,有没有什么办法可以从机器失联的告警中摒除中心端n9e服务挂了的情况呢?

1 Answers

机器失联告警是中心端去数据库查询机器列表中更新时间,所以我觉得如果中心端完全挂了再恢复,怕是难免会有失联告警,要是提前在数据库插入告警屏蔽也行。中心端可以起多个实例组成集群,来实现高可用,可以参考架构介绍

是n9e挂了之后,先数据库插告警屏蔽再启服务吗?

我觉得可以这样达到目的,还有一个方式是,刚启动的时候先暂时停用机器失联的告警,多等待几分钟再启用

暂时停用告警的话业务组比较多,一个个停有些麻烦,告警屏蔽可能合适一些,下次遇到试试,感谢!