Prometheus告警流程
2024-11-05 16:06:01 1 举报
Prometheus告警 alter流程 by lmm
作者其他创作
大纲/内容
开始
Prometheus定期拉取数据
Prometheus发出告警
是否恢复
等待:route.group_wait: 10s #等待10秒,告警汇聚
global.evaluation_interval=1m #评估告警规则和记录规则周期
Prometheus按照评估周期执行prometheus.rules.expr告警规则表达式如:span style=\"font-size: inherit;\
是否符合表达式
否
route.group_interval=30m #再次发送告警时间间隔
是route.repeat_interval=3h #告警恢复后3小时再次触发也不再重复发送通知
进入Firing状态
进入Pending状态
是group_by: ['alertname']
是否满足for持续时间
告警组:【pod的内存使用率高、high】
global.scrape_interval: 1m #1m拉取一次数据 global.scrape_timeout: 10s #拉取超时时间为10s
exporter /metrics数据指标接口
结束
告警组:【pod的内存使用率高、medium】
是
收藏
0 条评论
下一页