所有探针数据时断时续

Question

所有探针数据都是时断时续的，要断一起断，和服务端部署在一起的探针也是这样。
大概每隔两分钟就断两分钟，断的这段时间prometheus没数据。
请问是什么原因造成的？

ulricqin · Answer

可以看看日志哈，只有这些信息无法判断，每个相关模块的日志都看看

jackshzhao · Answer

时序图变成一段一段的
这是图表展示效果，时序图不连续

jackshzhao · Answer

五分钟内table格式
上传中...... 五分钟时序图

ulricqin · Answer

你看你最近5分钟只有2个点上报，显然前面说的categraf 15s上报一次这个前提就不成立。table视图明显可以看出，上报频率是232左右，你现在要去追查为啥上报频率不是15s，如果确保上报的频率是15s，就不会断线了，理论上上报频率小于2m（根据prometheus的启动参数可以判断）都不会断线

over

jackshzhao · Answer

经过测试，探针确实是每15秒上报一次，但prometheus没存下来，总丢数据，是因为什么呢？
（图中的tcp连接失败请忽略，是在做测试）

jackshzhao · Answer

经过测试，探针确实是每15秒上报一次，但prometheus没存下来，总丢数据，是因为什么呢？
（图中的tcp连接失败请忽略，是在做测试）

所有探针数据时断时续

6 Answers