首页  流程图  详情

Prometheus告警流程

2024-11-05 16:06:01   2  举报





Prometheus告警 alter流程 by lmm

Prometheus

作者其他创作

大纲/内容

开始

Prometheus定期拉取数据

Prometheus发出告警

是否恢复

等待：route.group_wait: 10s #等待10秒，告警汇聚

global.evaluation_interval=1m #评估告警规则和记录规则周期

Prometheus按照评估周期执行prometheus.rules.expr告警规则表达式如：span style=\"font-size: inherit;\

是否符合表达式

否

route.group_interval=30m #再次发送告警时间间隔

是route.repeat_interval=3h #告警恢复后3小时再次触发也不再重复发送通知

进入Firing状态

进入Pending状态

是group_by: ['alertname']

是否满足for持续时间

告警组：【pod的内存使用率高、high】

global.scrape_interval: 1m #1m拉取一次数据 global.scrape_timeout: 10s #拉取超时时间为10s

exporter /metrics数据指标接口

结束

告警组：【pod的内存使用率高、medium】

是

 收藏

立即使用

Prometheus告警流程

Kubernetes

职业：暂无

去主页





0 条评论

下一页

为你推荐

查看更多

