Helm部署的N9e,告警自愈模块要单独到服务器安装么

Viewed 126

目前使用Helm在K8s中部署的N9e,在做告警自愈测试的时候会报如下错误image.png,尝试到Helm Chart中找是否有告警自愈模块的插件开启方法,并没有找到(不知道是不是自己找的不对)。然后在官方文档说新版本的Categraf已经集成了(https://flashcat.cloud/docs/content/flashcat-monitor/nightingale/install/ibex/),只需要修改具体的配置即可,但是在helm chart 的categraf的config中没有找到对应的配置,烦请解答一下。

5 Answers

二进制方式怎么安装的告警自愈模块?

参考官方文档吧,我没有使用二进制安装过告警自愈模块

ibex-agent 的逻辑已经揉进了 categraf,在categraf的配置文件中开启 ibex相关的功能就可以了。ibex-server需要单独部署,部署完了之后把ibex-server的地址配置到夜莺里,v6版本的话在这个位置:
image.png

有没有考虑过把ibex-server写进chart中

而且这个入口感觉不是很搭,通知配置中配置告警自愈~~怪怪的

部署了server端,然后前端报超时image.png

后端日志没有任何有用的信息image.png

感觉ibex-server部署的一些前置条件没有说清楚?还是说使用Helm部署的categraf没有对应的权限?

helm是保持和二进制安装方式一样的,要单独部署ibex-server,helm没提供 。

部署完了 ibex 之后,还要注意,我们要对一批机器跑自愈脚本,需要指定机器列表,是指定为 hostname 还是指定为 ip 呢?这个需要看 categraf 的 config.toml 中的 hostname 的配置,默认这个配置留空,会自动探测机器的机器名作为唯一标识,此时在自愈脚本那里指定机器列表的时候,就要指定为机器名

我categraf二进制安装,测试这个自愈成功了,单独安装了ibex_server,查看某个目录下的内容image.pngimage.png