问题与解决
2024-03-17 10:26:18 0 举报
AI智能生成
问题与解决
作者其他创作
大纲/内容
技术栈
老代码
增量去债务
不引入新债务
债务规模(CR来规范流程)
中心化管理(以git为中心)
即时更新(用CR确认点来规范流程)
文档管理(背景、架构设计)
CR
单测
统一代码风格
代码质量
代码管理
log
metric
trace
架构图
通用
核心指标监控看板
质量日报
反馈渠道
业务
可观测性
多地部署
容量管理 + 流量调度能力 + 日常演练
核心模块是否有第一责任人以及备份责任人
容灾能力
代码扫描
单元测试
打包发布
CI/CD
资源上架
配置同步
通知与审批
流水线
自动化(省人工、减少错误降低排查返工工作量)
开发链路调试时间
现网问题排查时间
操作繁琐时间
摆脱老技术栈
算力成本
内存成本
带宽成本
数据治理。统一登记,监控状态,过期处理
存储成本
用度成本(硬件成本)
平台
能不能不调用
能不能少调用
用量成本(逻辑成本)
机器成本
查问题
运营自助
运营平台
AIGC
OpenTelmetry
新技术开拓
运营成本
预冷、预热
HPA
平滑发布、扩缩容
规定时间内发布
CR、方案评审,尽可能阻断不合理的发布
发布规范
服务质量
唯一ID
分布式锁
数据迁移
并发处理
资源调度
缓存设计
通用技术问题
业务通用问题
对账模块
扣款系统
消息空洞问题
消息触达率问题
IM系统
海量包问题
状态服务器问题
音视频系统
领域技术
多节点
无状态服务
副本 + 选主, DB或者消息中间件常用
共享内存 + 秒拉起, 只能在节点无物理问题时保证可用性
有状态服务
高可用
利用多核
减少锁冲突,类似redis
绑核,核心线程单独占用CPU
线程/进程模型设计
多路复用
零拷贝技术、DPDK库
绑核,多个CPU处理网络中断
网络IO模型设计
业务逻辑复杂度
连接池
内存池
无锁队列
常用技术
机器硬件纵向扩容
架构支持横向扩容
高性能
消息中间件
DB
业务至少一次语义
数据可靠性
DB: 事务
消息中间件:复制位移与选主截断
业务维度: DB与缓存,组件与组件之间
数据一致性
代码复杂度
模块耦合度
存储
可扩展性
基石问题
容器技术
微服务技术
流水线技术
云技术
问题与解决
0 条评论
回复 删除
下一页