运维平台产品设计
2024-03-06 14:40:29 1 举报
AI智能生成
我们的运维平台产品设计了一个强大且用户友好的解决方案,旨在帮助运维团队高效地管理、监控和自动化运维任务。该平台基于最新的ITIL最佳实践,提供了全面的功能,包括事件管理、问题管理、变更管理、配置管理、发布管理以及服务级别管理。此外,该平台还具有高度可扩展性和可靠性,支持与各种监控工具、IT服务管理工具以及自动化工具集成。通过这个平台,运维团队可以降低运维成本,提高服务效率,确保业务连续性。
作者其他创作
大纲/内容
功能模块梳理
账号管理
用户管理
角色管理
权限管理
审计管理
资产管理(CMDB)
资产类型
服务项目
服务名称
项目yaml配置
环境变量
ETCD配置
IDC信息
华东阿里云
华北阿里云
国科机房
存储设备
网络设备
交换机
防火墙
主机
物理机
云主机
虚拟机
云资源
SSL证书
域名
CDN
MySQL
Redis
ES
OSS
弹性IP
NAS
...
镜像仓库
docker镜像版本
k8s集群
DUI华东集群
DUI华北集群
DUI国科集群
...
k8s对象
Ingress
Istio
configmap
HPA
Label
...
功能
批量导入
批量更新
批量导出
组合查询
过期提醒
定期自动更新
服务更新模块
持续集成
tag触发构建
手动触发构建
测试模块
代码质量评估
单元测试
压力测试
测试用例管理
测试覆盖率
测试报告
部署模块
环境区分
开发环境
测试环境
beta环境
正式环境
...
服务发布
要求
自动化,无需人工介入
业务方可以自助操作
功能
支持AB Testing、金丝雀、rolling update、蓝绿发布
支持快速回滚
支持发布锁,当某个发布任务正在进行时,不允许其他任务发布
所有操作记录到数据库
支持pipeline式的组合更新方式
数据库更新
要求
基于CMDB
运维作业平台
要求
基于CMDB
功能
批量执行脚本
脚本管理(增删改查)
脚本授权
发布定时任务
自动备份
机器自动/批量申请
要求
基于CMDB
工单系统
人工介入
打通钉钉
数据统计分析
上线审核
对接监控系统
查看监控项
配置告警项
对接日志系统
通过接口获取日志
日志下载
跳板机
jumpserver
基于CMDB
目标及原则
目标
自动化
建设一站式的自动化运维平台,所有可以自动化的操作都需要沉淀到平台执行
原则1
标准化
通过平台统一管理所有的运维对象,对业务组、运维所有的操作都标准化
对hostname,ip,脚本,目录等运维对象制定标准规范,业务部门和运维部门遵循共同的标准,统一基于这个标准建设运维平台
对hostname,ip,脚本,目录等运维对象制定标准规范,业务部门和运维部门遵循共同的标准,统一基于这个标准建设运维平台
原则2
规范化
实现所有项目的持续集成、部署,都可以由项目组自助完成,提高发布效率,减少故障率
涉及到多部门协作,需要程序及文档固化,打造标准交付环境
涉及到多部门协作,需要程序及文档固化,打造标准交付环境
原则3
CMDB
完善的CMDB为所有运维自动化操作提供底层数据和配置支撑,形成完整闭环,驱动所有运维脚本、工具、任务正常执行
原则4
API
所有操作尽量提供API
工具参考
运维工具
ELK 日志组件
ansible
jenkins
k8s
docker
prometheus监控
开源项目
jumpserver
腾讯蓝鲸 https://bk.tencent.com/product/#community
bigops运维平台 http://docs.bigops.com/
OpsManage https://github.com/welliamcao/OpsManage
CODO自动化运维平台 https://github.com/opendevops-cn/opendevops
标准化对象
安全审计
SSH端口
iptables
各系统权限管控
所有操作记录
脚本
文件命名规范
变量命名规范
存放目录规范
bash/python版本要求
网络
网段划分
内外网IP设置规范
iptables配置
网关配置
掩码
操作系统
系统版本
内核版本
初始化安装
磁盘分区
账号密码
密钥
基础组件
nginx
java
mysql
redis
rsyslog
kafka
rabbitMQ
mongodb
nfs
ansible
kubernetes
docker
ES
logstash
supervisor
0 条评论
下一页