加入prometheus数据源后,基础设施里面能看到机器列表,但及时查询和快捷视图都查不到categraf的数据

Viewed 104

categraf使用的版本:0.3.2
categraf相关配置:
[[writers]]
url = "http://10.10.0.27:17000/prometheus/v1/write"

report os version cpu.util mem.util metadata
url = "http://10.10.0.27:17000/v1/n9e/heartbeat"

n9e使用的版本:v6.0.0-ga.6

image.png

image.png

4 Answers

不只是target_up指标,categraf采集的所有指标都没有

同问,我也是一样的现象,虽然可以触发失联告警,但查不到categraf的数据,就没什么用处了
可以请秦总UlricQin解答一下吗,谢谢

我印象好像中我遇到过这样情况,当时是n9e配置写错,导致数据没有入时序库,v6机器列表数据和redis有关,及时查询是和时序库有关。
另外告警触发我理解是categraf上报给n9e后它匹配db告警规则去查询时序库,满足条件生成告警,那么及时查询应该能有数据,还是多提供些配置或者其他线索吧

找到问题了。
查看n9e server的log,有如下错误

WARNING writer/writer.go:72 post to http://127.0.0.1:9090/api/v1/write got error: push data with remote write request got status code: 404, response body: remote write receiver needs to be enabled with --enable-feature=remote-write-receiver

needs to be enabled with --enable-feature=remote-write-receiver
在新版本中增加了一个参数:--enable-feature=remote-write-receiver,允许远程通过接口/api/v1/write,直接写数据到prometheus里面。

启动时添加参数:--enable-feature=remote-write-receiver 重启prometheus即可。
/opt/prometheus/prometheus --config.file=/opt/prometheus/prometheus.yml --web.listen-address=:9090 --enable-feature=remote-write-receiver

有点卡壳了,第一时间应该查看n9e的log的。抱歉。