categraf使用的版本:0.3.2
categraf相关配置:
[[writers]]
url = "http://10.10.0.27:17000/prometheus/v1/write"
report os version cpu.util mem.util metadata
url = "http://10.10.0.27:17000/v1/n9e/heartbeat"
n9e使用的版本:v6.0.0-ga.6
categraf使用的版本:0.3.2
categraf相关配置:
[[writers]]
url = "http://10.10.0.27:17000/prometheus/v1/write"
report os version cpu.util mem.util metadata
url = "http://10.10.0.27:17000/v1/n9e/heartbeat"
n9e使用的版本:v6.0.0-ga.6
v6 版本,n9e 服务端不再上报 target_up 这个监控指标了,可以看下这篇文章
夜莺监控(Nightingale)6.x 的机器失联告警设计
不只是target_up指标,categraf采集的所有指标都没有
我印象好像中我遇到过这样情况,当时是n9e配置写错,导致数据没有入时序库,v6机器列表数据和redis有关,及时查询是和时序库有关。
另外告警触发我理解是categraf上报给n9e后它匹配db告警规则去查询时序库,满足条件生成告警,那么及时查询应该能有数据,还是多提供些配置或者其他线索吧
找到问题了。
查看n9e server的log,有如下错误
WARNING writer/writer.go:72 post to http://127.0.0.1:9090/api/v1/write got error: push data with remote write request got status code: 404, response body: remote write receiver needs to be enabled with --enable-feature=remote-write-receiver
needs to be enabled with --enable-feature=remote-write-receiver
在新版本中增加了一个参数:--enable-feature=remote-write-receiver,允许远程通过接口/api/v1/write,直接写数据到prometheus里面。
启动时添加参数:--enable-feature=remote-write-receiver 重启prometheus即可。
/opt/prometheus/prometheus --config.file=/opt/prometheus/prometheus.yml --web.listen-address=:9090 --enable-feature=remote-write-receiver
有点卡壳了,第一时间应该查看n9e的log的。抱歉。