夜莺查询问题

Viewed 91

感觉夜莺 PromQL 查询的性能好差,我用原生 prometheus 的 dashboard 很快就查询出来,夜莺就老是卡死,想问下,能怎么优化?

3 Answers

问题描述清楚吧,背景是什么,期望什么, 现象什么等等

  • 环境:n9e-v6,已接入 4 个 prometheus 源,目前监控主机有 1k 多台
  • 现象:n9e 及时查询经常容易卡死,体验远不如 prometheus 后台的及时查询
  • 期望:希望能优化上述问题,想知道能从哪方面入手进行调优?

服务器查询链接情况,发现经常出现大量 "CLOSE_WAIT"

感觉也可能是我这边 prometheus 的问题吧,因为合规性要求,本地日志存储时间设置了 90d,所以有性能问题吧

查询语句贴下 + 看下prometheus ui显示命中的series条数。可能命中较多series + 大 time range 导致前端加载慢;
prometheus 自带web ui相对来说会稍快些;

max by (instance) (node_load1) > (count by (instance) (node_cpu_seconds_total{mode="system"}) * 2)

一下查 90day ?

不是,我是说 prometheus 的监控数据存储设置了保存 90d,不过问了 chat,跟这个没关系,算了,懒得管了,能凑合用就凑合用了,哈哈