监控体系
2024-04-25 11:29:52 1 举报
AI智能生成
监控体系脑图
作者其他创作
大纲/内容
监控方法论
Google的4个黄金指标
适用于应用服务监控
Latency延迟
请求延迟
Traffic流量
衡量服务的容量需求
Errors错误率
请求失败百分比
Saturation饱和度
衡量资源的使用情况
Netflix的USE方法
适用于主机指标监控
Utilization使用率
关注系统资源的使用情况
Saturation饱和度
针对资源的饱和度(不同于4个黄金指标中的饱和度),
例如CPU的平均运行排队长度.
例如CPU的平均运行排队长度.
Errors错误数
错误计数
Weave Cloud的RED方法
基于Goole的4个黄金指标原则, 适用于云原生应用的监控和度量
Rate: 每秒请求数
Errors: 每秒失败请求数
Duration: 每个请求的时长
监控对象分类(自底向上)
业务层监控
用于衡量应用程序的商业价值
QPS/DAU日活/MAU月活/转化率等
业务接口: 登录数/注册数/搜索量/订单量/支付量等
应用层监控
部署的各种业务应用
中间件(基础服务类)监控
消息队列
Kafka/RocketMQ/RabbitMQ等
Web容器
Tomcat/Jetty/Nginx等
数据库及缓存系统
MySQL/PostgreSQL/MongoDB/ElasticStack/Redis等
数据库连接池
ShardingSphere等
存储系统
Ceph/GlusterFS等
系统层监控
系统监控
CPU、内存、负载、交换分区、磁盘IO、内核参数、应用进程等
网络监控
网络设备、网络负载、网络延迟、丢包率
云原生时代的可观测性系统(CNCF)
监控系统(指标监控)
随着时间推移产生的可聚合数据点, 以Prometheus为代表的监控系统
日志系统(离散式的事件监控)
ElasticStack/PLGStack等
链路跟踪系统(分布式应用调用链跟踪)
Zipkin/Jaeger/SkyWalking/Pinpoint等
混沌工程系统
ChaosMonkey/ChaosBlade等
0 条评论
下一页