AHAS
2022-06-19 23:58:39 1 举报
AI智能生成
AHAS 学习
作者其他创作
大纲/内容
定义
业界首款专注于应用高可用能力的SaaS产品,提供应用架构自动探测,故障注入式高可用能力评测和一键应用限流降级等功能,可以让用户快速低成本的提升应用可用性;
使用场景
应用生命周期管理
各种应用场景对于高可用的需求
流量洪峰
API 精准流量控制
削峰填谷
慢启动
适用场景
新系统新架构上线
分布式系统依赖治理
业务连续性
故障修复验证
接入方式
java
Agent接入
SDK接入
K8s 接入
SAE 接入
网关防护
防护手段
入口流量控制
热点隔离
对依赖方隔离或降级
系统防护
主要功能
针对路由配置中的某个路由进行流量控制
自定义一组API 进行流量控制
针对请求的客户端IP,Header或者URL 参数进行流控
限制某个API 的调用频率,支持秒,分钟,小时,天等多个维度
接入方式
容器服务Kubernetes应用
Spring Cloud GateWay应用
Spring Cloud Zuul 应用
通过Agent 接入
接入Nginx
系统保护阈值
Load
CPU使用率
RT
线程数
入口QPS
功能
架构感知
概念
自动感知应用的拓扑结构
以可视化的方式直观呈现应用对基础架构的依赖关系和组件间的依赖关系
持续记录上述依赖关系
第三方组件与云服务识别
Kubernetes 集群感知
工作流程
数据采集
关系构建
特征识别
架构可视化
可接入资源
普通Linux主机
云服务器ECS
容器服务K8s
需访问资源
负载均衡SLB
专有网络VPC
云服务器ECS
故障演练
AHAS 的故障演练功能承担着问题发现,问题验证,高可用经验沉淀的作用
支持场景
常见的基础设施资源故障
应用级别的故障注入
云原生领域的演练场景
功能
衡量微服务的容错能力
验证容器编排配置是否合理
测试PaaS 层是否健壮
验证监控告警的时效性
定位与解决问题的应急能力
流程
阿里云界面
创建演练
演练配置
执行演练
停止演练
主体
计划
执行
观察
记录
还原
分析
爆炸半径影响范围
故障注入
流量路由
数据隔离
流控降级
接入方式
SDK
Agent
流量控制
限流方式
直接模式(按调用方限流)
关联模式(关联资源限流)
链路模式(调用链路限流)
实现方式
运行指标
QPS
并发线程数
资源的调用关系
资源的调用链路
资源和资源之间的关系
调用来源等
控制效果
直接拒绝
资源隔离
隔离规则通过控制接口或依赖的并发线程数,来保证系统的稳定性
快速失败
熔断降级
熔断降级会在调用链路中某个资源出现不稳定状态时,对这个资源的调用进行限制,让请求快速失败,避免影响到其他的资源而导致级联错误
策略
秒级RT模式
秒级异常比例模式
分钟级异常数模式
Warm UP (预热)
Warm UP 当流量突然增大的时候,希望系统从空闲状态到繁忙状态的切换的时间长一些,即如果系统在此之前长期处于空闲的状态,希望处理请求的速率缓慢增加,经过预期的时间以后,到达系统处理请求速率的设定值;
默认会从配置QPS闽值的1/3开始慢慢往上增加QPS
排队等待
功能开关
对应开源
ChaosBlade
https://chaosblade.io/zh/docs/
0 条评论
下一页