告警通知模板设计
2023-05-06 13:56:59 9 举报
AI智能生成
告警通知模板设计
作者其他创作
大纲/内容
埋点
埋点_请求量:qps.go 调整msg,AppName去掉 QPS急 修改WarnSrc: 埋点_请求量
埋点_平均响应时间、 埋点_成功率、埋点_失败率: alertHead改为埋点_平均响应时间/埋点_成功率/埋点_失败率 ;ratio.go 调整msg,AppName去掉alertHead + ":" +, 修改WarnSrc: alertHead
服务器
1分钟内平均负载、5分钟内平均负载、15分钟内平均负载:load.go WarnHead改为 服务器_负载
内存使用率:mem.go WarnHead改为 服务器_内存使用率
硬盘使用率:disk.go WarnHead改为 服务器_硬盘使用率
系统CPU使用率、用户CPU使用率:cpu.go WarnHead改为 服务器_CPU使用率
网络接收、网络发送:net.go WarnHead改为 服务器_网络
进程数:processes.go WarnHead改为 服务器_进程数
TCP连接数、TCP等待关闭连接数、TCP主动关闭连接数、硬盘IO读、硬盘IO写:warntype10.go 调整msg AppName:c.MetricsKey
TCP连接数:c. metrics_type == TCP_Established WarnSrc: 服务器_TCP连接数
TCP等待关闭连接数: c. metrics_type == TCP_Time_Wait WarnSrc: 服务器_TCP等待关闭连接数
TCP主动关闭连接数 c. metrics_type == TCP_Close_Wait WarnSrc: 服务器_TCP主动关闭连接数
硬盘IO读 c. metrics_type ==DISK_IO_Read WarnSrc: 服务器_硬盘IO读
硬盘IO写 c. metrics_type ==DISK_IO_Write WarnSrc: 服务器_硬盘IO写
服务器心跳: WarnHead 服务器_心跳
心跳
hb.go 调整msg AppName:w.AppName, WarnSrc:hbErrorIps + "埋点_心跳"
JVM
jvm.go 调整msg AppName:w.AppName,
Full GC执行次数 WarnSrc:JVM_Full GC执行次数
堆内存使用率 WarnSrc:JVM_堆内存使用率
young_GC执行次数 WarnSrc:JVM_young_GC执行次数
活动线程数 WarnSrc:JVM_活动线程数
进程监控
proc.go 调整msg AppName:w.AppName
CPU使用率 WarnSrc:进程_CPU使用率
内存使用量 WarnSrc:进程_内存使用量
文件句柄数 WarnSrc:进程_文件句柄数
线程数量 WarnSrc:进程_线程数量
IO读入大小 WarnSrc:进程_IO读入大小
IO写入大小 WarnSrc:进程_IO写入大小
进程存活
warntype10.go 如果c. metrics_type ==running 调整msg WarnSrc:进程_存活 Key:c.metrics_key
探针告警
probe.go 调整msg AppName:w.AppName WarnSrc: 探针_失败次数 Key: c.MetricsKey
日志关键字告警
log.go 调整msg AppName:c.MetricsKey WarnSrc: 日志_关键字
中间件告警
warntype10.go 如果c. metrics_type 包含middleware 调整msg WarnSrc: c.metrics_type Key:c.metrics_key
接口监控
warntype10.go 如果c. metrics_type ==ApiGateway 调整msg Key:c.metrics_key
请求次数: WarnSrc: 接口_请求次数
业务状态码:WarnSrc: 接口_业务状态码
HTTP状态码:WarnSrc: 接口_HTTP状态码
平均响应时间:WarnSrc: 接口_平均响应时间
限流次数:WarnSrc: 接口_限流次数
rig qywx.go模板调整
旧的模板:
message := fmt.Sprintf("ID:%s, %s!%s!%s,%d分内,%s%s @%s", m.ID, m.State, m.AppName, src, m.WithMinutes,
m.Warning, minMaxMsg, m.Time)
调整为:
{ID},{告警状态(持续时间)}{xx环境:资源名}{埋点类型,统计周期,告警规则,(最大值/最小值)/当前值}{告警触发时间}
src := m.WarnSrc
message := fmt.Sprintf("ID:%s, %s!%s!%s,近%d分内,%s%s ,%s", m.ID, m.State, m.AppName, src, m.WithMinutes,
m.Warning, minMaxMsg, m.Time)
旧的模板:
message := fmt.Sprintf("ID:%s, %s!%s!%s,%d分内,%s%s @%s", m.ID, m.State, m.AppName, src, m.WithMinutes,
m.Warning, minMaxMsg, m.Time)
调整为:
{ID},{告警状态(持续时间)}{xx环境:资源名}{埋点类型,统计周期,告警规则,(最大值/最小值)/当前值}{告警触发时间}
src := m.WarnSrc
message := fmt.Sprintf("ID:%s, %s!%s!%s,近%d分内,%s%s ,%s", m.ID, m.State, m.AppName, src, m.WithMinutes,
m.Warning, minMaxMsg, m.Time)
host.go 修改 AppName : host, WarnSrc:WarnHead
调整邮件模板:
notify.MailTpl = util.LoadTmpl(fnMap, "mailTpl.html", linkDiv)
notify.MailTplV2 = util.LoadTmpl(fnMap, "mailTplV2.html", linkDiv)
notify.MailTpl = util.LoadTmpl(fnMap, "mailTpl.html", linkDiv)
notify.MailTplV2 = util.LoadTmpl(fnMap, "mailTplV2.html", linkDiv)
0 条评论
下一页