n9e 升级后机器全都是失联状态,是什么原因?
找到原因了,docker启动的n9e 是老版本,拷贝新版本进去就好了,至于为什么是老版本就不知道了。
来猜一下,升级是指在v4,5版本升级v6,机器失联是指没有心跳上报更新数据库的时间,有对象列表代表数据通过n9e转发到时序库,按这个线索来,配置文件问题,官网有文档看看心跳相关配置,希望能猜对,哈哈哈
是小版本v6升级来着,我重新安装了一个干净的n9e,基础设施找不到agent了,好奇怪~
找不到agent上面down状态就是正常的,但是为啥没有呢,你要不看看采集器的日志,不好猜。不过我想到v6的新版最近把合并pugw和alert为edge,会是这个原因导致的吗,配置文件的改动在github里有
v6.0.0-ga.6 换成这个版本就可以,之后的版本不行
heartbeat 那边改动了吗?
heartbeat这边配置是这样的 [heartbeat] enable = true url = "http://192.168.207.157:17000/v1/n9e/heartbeat"
这个配置没问题。可以检查下采集器和n9e有没有错误日志