稳定性体系建设
2021-10-12 01:20:18 76 举报
111
作者其他创作
大纲/内容
应急手册
架构设计
目标:全域业务的年可用性均达到99.9%( 8.76小时)
业务监控
故障发现
Q3做
改进验收跟踪
...
故障自愈
容量规划
巡检
数据运营
故障恢复
故障演练
故障现场(快照)
事后
故障响应统计
重大变更规范
Oncall
隐患跟踪统计
日志、链路
已做
搜车稳定性体系建设
隐患异常消除
故障处理规范
告警处理率统计
故障改进
事中
舆情感知
事前
P0业务故障定级标准
应用拓扑
规划做
故障预防
业务稳定性分
故障定位
....
AIOPS
故障复盘
监控告警覆盖度
限流降级
容量压测
0 条评论
下一页
为你推荐
查看更多