登录免费注册

首页  思维导图  详情

监控方法论

2020-07-28 16:53:21   0  举报





AI智能生成

监控方法论

监控方法论

作者其他创作

大纲/内容

主机监控

系统资源

使用率（Utilization）

资源忙于工作的平均时间。它通常用随时间变化的百分比表示

饱和度（Saturation）

资源排队工作的指标，无法再处理额外的工作。通常用队列长度表示

错误（Error）

资源错误事件的计数

应用程序级监控

面向用户

流量

针对系统，例如，每秒 HTTP 请求数，或者数据库系统的事务

通讯量

监控当前系统的流量，用于衡量服务的容量需求

错误

请求失败的速率，要么是 HTTP 500 错误等显式失败（Nginx抓取），

要么是返回错误内容或无效内容等隐式失败（服务钩子），或者基于策略原因导致的失败

饱和度

应用程序有多“满”，或者受限的资源，如内存或 IO。

这还包括即将饱和的部分，例如磁盘是否可能在1小时内就满了

告警和通知

哪些问题需要通知

通知简洁、清晰、准确，易于理解并且可操作，杜绝告警风暴，添加上下文

例如：磁盘监控超80%，剩余的20%可以支持多久？增长速度？凌晨2点收到需要起来处理吗？

谁需要被告知

告警负责人

如何告知他们

通知方式：短信，邮件，微信，钉钉。。。

何时停止告知以及何时升级到其他人

故障自愈通知，问题无法解决升级？

 收藏

立即使用

 收藏

立即使用

 收藏

立即使用

数据库备份还原流程

 收藏

立即使用

系统架构设计

职业：本科













评论

0 条评论

下一页

为你推荐

查看更多



2025产品经理管理方法论

低风险创业方法论精要 (1)

项目实施方法论

产品方法论

软件产品方法论

低风险创业方法论精要



图形选择

思维导图

主题

补充说明

AI生成





修改AI描述

去编辑

重新生成

提示 

关闭后当前内容将不会保存，是否继续？

取消

确定