恢复流程
2023-07-10 18:24:00 5 举报
登录查看完整内容
呃呃呃
作者其他创作
大纲/内容
资源不足
运维快速回滚
回滚
运维做sql限流操作
否
是否限流
查看对应的慢sql
反馈给研发
初步判断
近期所有变更进行回滚
上线
故障结束
根据异常日志定位问题
异常日志
给出方案以及解决时间
扩容后观察情况
初步判断故障,是否需要重启
是
运维查看各类资源的健康状况
近期上线的内容
观察线上情况
升级故障级别并上报
查看是否有大量的慢sql
观察是否恢复
判断是否需要扩容
根据DDOS预案进行恢复
健康
恢复
发出对应的慢sql
不健康
故障发生
运维做快速扩容
最小化复现,通过代码解决问题
重启后,观察故障是否解决
基础资源无需处理
判断是否要回滚,以及回滚后是否有异常
故障恢复
扩容资源
进入回滚流程
运维快速重启对应服务
初步定位,并同步近期上线代码的对应研发
判断是否DDOS攻击
修复后,在上线
重启
收藏
0 条评论
回复 删除
下一页