问题与解决
2024-03-17 10:26:18 0 举报
AI智能生成
问题与解决
作者其他创作
大纲/内容
业务通用问题
代码管理
债务规模(CR来规范流程)
增量去债务
技术栈
老代码
不引入新债务
文档管理(背景、架构设计)
中心化管理(以git为中心)
即时更新(用CR确认点来规范流程)
代码质量
CR
单测
统一代码风格
可观测性
通用
log
metric
trace
架构图
业务
核心指标监控看板
质量日报
反馈渠道
容灾能力
多地部署
容量管理 + 流量调度能力 + 日常演练
核心模块是否有第一责任人以及备份责任人
运营成本
自动化(省人工、减少错误降低排查返工工作量)
CI/CD
代码扫描
单元测试
打包发布
流水线
资源上架
配置同步
通知与审批
摆脱老技术栈
开发链路调试时间
现网问题排查时间
操作繁琐时间
机器成本
平台
用度成本(硬件成本)
算力成本
内存成本
带宽成本
存储成本
数据治理。统一登记,监控状态,过期处理
业务
用量成本(逻辑成本)
能不能不调用
能不能少调用
运营平台
查问题
运营自助
新技术开拓
AIGC
OpenTelmetry
服务质量
平滑发布、扩缩容
预冷、预热
HPA
发布规范
规定时间内发布
CR、方案评审,尽可能阻断不合理的发布
通用技术问题
唯一ID
分布式锁
数据迁移
并发处理
资源调度
缓存设计
领域技术
扣款系统
对账模块
IM系统
消息空洞问题
消息触达率问题
音视频系统
海量包问题
状态服务器问题
基石问题
高可用
无状态服务
多节点
有状态服务
副本 + 选主, DB或者消息中间件常用
共享内存 + 秒拉起, 只能在节点无物理问题时保证可用性
高性能
线程/进程模型设计
利用多核
减少锁冲突,类似redis
绑核,核心线程单独占用CPU
网络IO模型设计
多路复用
零拷贝技术、DPDK库
绑核,多个CPU处理网络中断
常用技术
业务逻辑复杂度
连接池
内存池
无锁队列
机器硬件纵向扩容
架构支持横向扩容
数据可靠性
消息中间件
DB
业务至少一次语义
数据一致性
DB: 事务
消息中间件:复制位移与选主截断
业务维度: DB与缓存,组件与组件之间
可扩展性
代码复杂度
模块耦合度
消息中间件
DB
存储
云技术
容器技术
微服务技术
流水线技术
0 条评论
下一页