SLA-服务水平协议-必知必会
2021-03-27 14:25:14 5 举报
AI智能生成
一图读懂服务水平协议SLA的方方面面
作者其他创作
大纲/内容
01.概念汇总
服务目录
服务目录决定了SLA约束的服务范围,即服务商到底提供哪一些服务,只有客户“选择”了的服务目录,服务商才会报价与后续的响应,在服务目录之外的内容,将不受SLA的限制
服务日历
服务日历决定了SLA约束的时间范围,即服务商为客户提供X*X的服务响应期,是7*24还是5*8,是否扣除一个周期内的法定假期,很多服务商有自己的公司日历,事实上,每一个服务型的项目存在着一个服务日历,服务日历与公司日历很多时候不是相同的,不同则意味着成本的增加与管理难题的增加,这需要进行在报价结算时综合考虑,因为它直接关系到人力的配备与排班,服务日历跟各种监视计划也有直接的关系,它还跟SLA的测量有关联关系
可用性
可用性,通常的公式是:可用率=(AST-DT)/AST*100。AST(agreed service time)是指约定的服务时间即上面提到的服务日历,DT(Actual downtime during agreed servicetime)在约定服务时间内的停机时间。
不可用
用户的操作在一定的时间内得不到任何响应
日常系统维护、用户原因、不可抗力引起的不可用不计入不可用时间
SLA定义
服务等级协议(SLA)最根本的形式是协议双方(服务提供者和用户)签订的一个合约或协议,这个合约规范了双方的商务关系或部分商务关系。一般来说,SLA是服务提供者与用户之间协商并签订的一个具有法律约束力的合同,合同规定了在服务提供过程中双方所承担的商务条款
=SLO+后果
Service Level Agreement = 服务质量/水平协议
SLO
Service Level Objective = 服务质量/水平目标
视角
对外
满意度
对内
服务可用性
SLI
Services Level Indicator = 服务质量/水平指标
你不需要把监控系统中每个metric都视为SLI,选择尽可能少的SLI,但这些SLI却能说明服务是否健康
视角
用户端指标
技术侧指标
MTTR
平均修复时间(Mean time to repair,MTTR),是描述产品由故障状态转为工作状态时修理时间的平均值。
MTBF
MTBF,即平均无故障工作时间,英文全称是“Mean Time Between Failure”。是衡量一个产品(尤其是电器产品)的可靠性指标。
02.如何计算
SLO的计算
1年 = 365天 = 8760小时
99.9 = 8760 * 0.1% = 8760 * 0.001 = 8.76小时
99.99 = 8760 * 0.0001 = 0.876小时 = 0.876 * 60 = 52.6分钟
99.999 = 8760 * 0.00001 = 0.0876小时 = 0.0876 * 60 = 5.26分钟
99.9 = 8760 * 0.1% = 8760 * 0.001 = 8.76小时
99.99 = 8760 * 0.0001 = 0.876小时 = 0.876 * 60 = 52.6分钟
99.999 = 8760 * 0.00001 = 0.0876小时 = 0.0876 * 60 = 5.26分钟
SLO的指标
范例
每分钟平均qps > 100k/s
99% 访问延迟 < 500ms
99% 每分钟带宽 > 200MB/s
99% 访问延迟 < 500ms
99% 每分钟带宽 > 200MB/s
服务台KPI计算
工单数量趋势
企业规模扩大
支持更多智能
基础设施稳定性下降
首次呼叫解决率
缺少请求者和系统信息
技术人员能力差
知识传播和共享不良
03.大厂SLA范例
七牛云
https://www.qiniu.com/sla-kodo
微软
https://www.microsoftvolumelicensing.com/DocumentSearch.aspx?Mode=3&DocumentTypeId=37
阿里云
https://help.aliyun.com/document_detail/64695.html
腾讯云
https://cloud.tencent.com/document/product/301/39158
04.规划路径
step1
服务侧
满意度
服务目录
step2
运维侧
可用性
核心业务列表
0 条评论
下一页