n9e v6移除了target up指标之后,如何通过读取prometheus指标展示故障的机器

Viewed 70

需求是需要在grafana上展示故障的主机清单,需要有个类似target up的字段来获取机器是否离线

1 Answers

没有 target_up 这样的指标了。有两个办法可以查看失联的机器:

1,v6.0.2版本,支持在机器列表页面筛选心跳时间。比如查看最近5分钟都没有过心跳的机器:
image.png

2,把夜莺的数据库 n9e_v6 作为 mysql 数据源添加到 Grafana 中,在 Grafana 里查看 target 表,根据 update_at 字段进行筛选,如果 update_at 小于当前时间-5分钟,就说明这个机器已经有5分钟没有过心跳,也没有过监控数据上报了