超融合系统
2024-07-22 16:18:34 0 举报
AI智能生成
超融合系统思维导图
作者其他创作
大纲/内容
中心节点 (MSCNA):
虚拟化管理 (VRM)
集群资源管理
集中管理集群中的所有计算、存储和网络资源,确保资源的高效分配和使用
虚拟机生命周期管理
负责虚拟机的创建、启动、停止、暂停、恢复、迁移和删除等操作
资源调度
根据虚拟机的工作负载和资源需求,动态调整资源分配,实现负载均衡
高可用性
确保虚拟机在物理服务器发生故障时能够快速在其他服务器上恢复运行
监控与性能分析
实时监控虚拟机的运行状态和性能指标,提供性能分析报告
虚拟化主机 (FOC)
主机监控
监控主机硬件的状态,包括CPU、内存、磁盘、网络等
虚拟化环境维护
管理和维护虚拟化环境,包括虚拟化软件的更新和补丁应用
资源隔离
确保不同虚拟机之间的资源隔离,避免相互干扰
存储和计算功能 (可选)
存储服务
提供数据存储服务,支持创建和管理虚拟磁盘、快照、备份等
计算能力
提供额外的计算能力,用于运行虚拟机或特定的计算任务
管理节点 (MCNA):
虚拟化管理 (VRM)
计算资源池管理
创建和管理计算资源池,为虚拟机提供必要的CPU和内存资源
虚拟机模板管理
管理虚拟机模板,快速部署新的虚拟机实例
虚拟化主机 (FOC)
与中心节点的FOC功能相同,专注于管理虚拟化主机的状态和资源
计算功能
计算资源扩展
提供额外的计算资源,用于支持更多的虚拟机或更高性能要求的任务
资源优化
通过优化算法提高计算资源的利用率和性能
存储计算节点 (SCNA):
分布式存储 HDD 磁盘
SCNA 节点配备了大量的 HDD 磁盘,用于存储数据
SSD Cache 存储
SCNA 节点还配备了 SSD 缓存盘,用于加速数据访问
虚拟化计算资源
SCNA 节点上的计算资源被虚拟化,并通过 KVM 虚拟化技术提供给虚拟机使用
计算节点 (CNA):
虚拟化计算资源
通过 KVM 虚拟化技术实现
将物理服务器上的计算资源(CPU、内存等)虚拟化,并提供给虚拟机使用
场景
Web 服务器
虚拟化计算资源可以用于运行 Web 服务器,例如 Apache、Nginx 等
数据库服务器
虚拟化计算资源可以用于运行数据库服务器,例如 MySQL、Oracle 等
应用服务器
虚拟化计算资源可以用于运行应用服务器,例如 Tomcat、JBOSS 等
测试环境
虚拟化计算资源可以用于搭建测试环境,方便进行软件测试
存储节点 (SNA):
分布式存储 HDD 磁盘
SSD Cache 存储
虚拟化平台:
虚拟机资源管理 (VRM)
资源管理
集中管理和监控虚拟资源、业务资源、用户资源的关键组件
平台管理
提供一个统一的界面,用于配置、监控、和调整虚拟机及其相关资源
主机软件 (FOC)
运行在物理服务器上的虚拟化操作系统,包含计算、网络、存储虚拟化模块,每个节点部署VNA代理,以与VRM通信,实现资源的虚拟化和管理
跨主机热迁移 (IMC 支持跨代次)
支持在计算集群内不中断业务的情况下,将虚拟机从一台物理服务器迁移到另一台,利用内存数据快速复制和共享存储技术保持数据一致性
虚拟机高可用性 (HA)
计算节点故障时,系统会自动在健康的计算节点上重新创建虚拟机,确保业务连续性。无论是计算节点掉电重启还是虚拟机蓝屏,只要配置了HA策略,系统都能迅速响应并恢复
虚拟机存储热迁移
允许管理员在虚拟机运行时手动迁移其磁盘到其他存储单元,实现存储资源的动态调整,有助于设备维护和资源优化。
自动精简配置 (Thin Provisioning)
为虚拟机提供超过实际物理存储的虚拟存储空间,仅在数据写入时分配物理存储资源,有效提高存储利用率和降低初期成本
无代理防病毒 (基于安全虚拟机)
通过安全虚拟机部署防病毒引擎,其他虚拟机通过轻量级驱动与之交互,无需在每台虚拟机上安装防病毒软件
动态资源调度 (DRS)
根据预设策略智能地在集群内自动迁移虚拟机,平衡资源使用,降低能耗,并根据系统负载动态调整
虚拟机资源 QoS (CPU、网络)
提供CPU和网络资源的QoS管理,通过份额、预留等参数确保虚拟机间的资源隔离和优先级,保证关键业务性能
用户态交换模式 (DPDK)
利用Data Plane Development Kit (DPDK)技术提高网络数据包处理性能
分布式虚拟交换机
实现网络虚拟化,为虚拟机提供高性能的网络连接,支持复杂的网络配置和策略实施
SR-IOV (x86)
支持单根I/O虚拟化技术,允许虚拟机直接访问物理硬件资源,如网卡,提高网络吞吐量和降低延迟
GPU 直通
允许虚拟机直接使用物理GPU资源,适合图形密集型应用和计算任务,如深度学习、图形渲染等
软件高可靠 (双节点主备、数据备份)
通过双节点主备配置和数据备份机制,确保关键系统组件和服务的高可用性,防止数据丢失
快照 (ROW 机制,秒级)
提供快速创建虚拟机状态的快照功能,支持秒级快照,便于数据保护和快速恢复
虚拟机回收站
删除的虚拟机会暂时存放于回收站,便于误删后的恢复,增加了操作的灵活性和安全性
虚拟机安全删除
提供安全删除选项,通过覆盖性擦写磁盘空间来永久删除虚拟机数据,防止信息泄露
网络安全组 (白名单/黑名单)
实施网络访问控制,支持配置白名单和黑名单规则,增强虚拟机网络层面的安全防护
异构导入 (OVF/OVA)
支持从Vmware导入OVF或OVA格式的虚拟机模板,简化异构环境下的虚拟机迁移
虚拟机热迁移加速 (QAT)
利用Intel V7 CPU集成的QAT加速器,加速虚拟机迁移过程中的数据压缩和解压缩,提升迁移速度和成功率,同时不占用CPU资源
分布式存储:
全分布式和 Share Nothing 架构
全分布式
确保没有单一的集中管理或控制节点
Share Nothing
每个存储节点都能独立工作,且节点间通过高效的分布式协议协作,实现去中心化、无状态的数据处理,这样既保证了系统的无单点故障,也避免了性能瓶颈
数据路由算法 (DHT)
采用基于策略的分布式哈希表(DHT)数据路由算法,直接通过计算定位数据所在存储节点,无需元数据查询,减少了数据访问路径,提高了系统性能
存储接口层 (RestAPI、RBD)
对外提供RESTful API和RBD(RADOS Block Device)接口,便于与其他系统集成和管理
存储服务层 (快照、精简配置、SSD 加速等)
提供一系列高级存储服务,包括但不限于快照、精简配置、SSD加速等,增强存储资源的灵活性和效率
存储引擎层 (集群状态管理、数据路由、复制协议等)
涵盖集群状态管理、数据的分布式路由、强一致性复制协议以及故障自愈机制,确保数据的高可用性和一致性
存储硬件层
SAS
SATA
NVMe
存储管理层 (可视化安装、配置、监控、告警等)
可视化安装
可视化配置
监控
告警
关键特性:
快照 (ROW 机制,秒级)
使用ROW(Redirect-On-Write)机制,快照几乎瞬间完成,对业务性能影响极小,支持秒级恢复
LUN Masking
控制LUN访问权限,确保未授权用户无法访问敏感数据
快速离线
当硬件故障时,系统能快速隔离故障节点,减少对业务的影响
卷级 QoS
精细化控制每个卷的IOPS和带宽,确保业务性能
扩容
磁盘扩容
节点扩容
异步复制
实现分钟级的数据异步远程复制,支持跨数据中心的数据保护
延展集群 (跨数据中心)
将存储集群延伸至两个数据中心,确保在数据中心故障时,业务自动切换,实现RPO=0
精简配置
提供比实际物理存储更多的虚拟存储空间,提高存储效率
卷克隆
支持从快照创建链接克隆卷,便于数据备份和测试
节点冗余设计
无单点故障,任何节点故障不影响系统可用性
卷独占
保证逻辑卷数据一致性,确保数据修改操作的正确性
硬件设备平台:
计算节点:
2288H V6 (2U2P)
形态
2U机架式服务器,配备2个处理器插槽
处理器
支持Intel Xeon Icelake Processors系列(43、53、63、83系列)
内存插槽
提供32个DDR4 DIMM插槽
硬盘配置
8个2.5英寸SAS/SATA硬盘
网络支持
支持GE、10GE、25GE的OCP网卡
PCIe扩展
根据配置不同,支持1个RAID控制卡专用的PCIe扩展槽位,1至2个OCP 3.0网卡专用的FLEX IO扩展槽位,以及3至8个标准的PCIe扩展槽位,具体取决于是否配置了GPU卡
2488H V6 (2U4P)
形态
2U机架式服务器,配备4个处理器插槽
处理器
采用Intel Xeon CooperLake Processors系列(53、63、83系列)
内存插槽
配备48个DDR4 DIMM插槽
硬盘配置
同样提供8个2.5英寸SAS/SATA硬盘
网络支持
同样支持GE、10GE、25GE的OCP网卡
PCIe扩展
提供更为丰富的扩展能力,包括11个PCIe 3.0扩展槽位,1个OCP 3.0网卡专用的FLEX IO插卡扩展槽位,以及额外的Riser卡和板载PCIe扩展槽位
2288H V7 (2U2P)
形态
更新一代的2U机架式服务器,仍为2个处理器插槽
处理器
搭载了更先进的Intel Xeon Sapphire Rapids Processors系列(44、54、64、84系列)
内存插槽
同样配备32个插槽,但升级为DDR5 DIMM
硬盘配置
8个2.5英寸SAS/SATA硬盘
PCIe扩展
网络支持与2288H V6相同,PCIe扩展方面,对于配置硬盘模组/PCIe Riser模组的机型,支持2个OCP 3.0网卡专用槽位和8个标准的PCIe扩展槽位
融合节点:
基础型 (2U2P)
形态
2U机架服务器,2个处理器插槽,支持1至2个Intel Xeon Icelake处理器
硬盘配置
12个3.5英寸SAS/SATA硬盘
扩展能力
根据CPU数量,提供不同数量的PCIe扩展槽位,支持RAID控制卡、OCP网卡及标准PCIe扩展
容量型 (2U2P)
形态
2U2P机架服务器
硬盘配置
结合大容量硬盘和高速NVMe SSD,包括12个3.5英寸SAS/SATA硬盘,2个2.5英寸SAS/SATA硬盘,以及4个NVMe SSD盘
扩展能力
提供特定数量的PCIe扩展槽位,支持RAID控制卡和OCP网卡的FLEX IO扩展
处理器与内存
搭载2个Intel Xeon Icelake或Sapphire Rapids Processors,32个DDR4或DDR5 DIMM插槽
均衡型 (2U2P)
形态
2U机架服务器,设计上追求计算与存储的平衡
硬盘配置
总硬盘数量最多,包括25个2.5英寸SAS/SATA硬盘,以及额外的2个SAS/SATA硬盘和4个NVMe SSD盘,适合需要大量存储容量和一定I/O性能的应用场景
性能型 (2U2P, 2U4P)
形态
提供两种形态,分别为2U2P和2U4P机架服务器
硬盘配置
针对不同需求,提供24个2.5英寸NVMe SSD或25个2.5英寸SATA SSD,以及额外的2个SAS/SATA硬盘
扩展能力
强调高性能存储,尤其是NVMe配置下,提供专为高速数据访问优化的PCIe扩展槽位
处理器与内存
2U2P型号搭载Intel Xeon Icelake Processors,32个DDR4 DIMM插槽;2U4P型号使用Intel Xeon CooperLake Processors,48个DDR4 DIMM插槽
统一运维管理
自动化部署
系统发现与配置
利用SSDP自动发现服务器并通过KVM挂载光盘引导安装,最多可并行安装8个节点,同时通过NFS共享传输安装包和配置
一键安装
一键安装
依托开源工具,支持在PC或虚拟机上快速部署系统软件
系统初始化
允许修改管理IP地址并执行系统初始化。该过程自动发现物理节点和管理虚拟机,配置网络参数和存储池参数,自动完成网络配置、集群创建、存储池与计算集群的构建,使系统即刻具备虚拟机发放能力
设备自动发现 (SSDP)
在安装、初始化及扩容阶段,通过SSDP协议,服务器BMC自动广播IPv6地址,Installer和服务端自动监听并收集这些地址,从而识别和配置新加入的设备,简化了设备管理流程
资源管理 (虚拟化、存储、网络)
提供虚拟化资源的集中管理,如创建管理虚拟机、虚拟机卷设备及网络配置,支持IDE、VIRTIO、SCSI接口类型的卷设备,以及瘦分配卷以优化磁盘使用
硬件管理
实现硬件设备的图形化监控,包括机箱、服务器、交换机的状态监控,展示节点类型、型号、IP地址等硬件信息
性能监控
CPU使用率
内存使用率
IOPS
磁盘利用率
网络流量
IO时延
告警管理
系统监控并管理所有组件的告警,包括硬件、虚拟化平台、存储等,支持告警设置与统计,及时通知管理员
操作日志管理
记录并管理操作日志,便于审计与故障追溯
权限管理
支持用户和角色管理,配置密码策略和域认证,确保系统访问安全
一键式运维
扩容
支持快速扩容,通过SSDP扫描发现新节点并自动配置
巡检
健康检查自动化执行,快速定位问题
日志收集
日志一键收集,便于故障分析
在线升级
提供系统在线升级能力,确保业务连续性,支持升级包管理、智能版本匹配和向导式升级流程
应用市场
用户可访问的应用市场,用于获取、部署预置或第三方应用程序,加速业务部署
硬件故障预测
硬盘
内存
远程运维和移动运维
支持远程访问和移动设备上的运维操作
服务器故障可视化
显示服务器故障状态的直观视图,帮助快速识别与处理问题
快照策略
支持虚拟机快照策略配置,包括周期性快照、快照类型设定及快照数量上限,实现自动化运维
所画即所得 (网络拓扑可视化)
网络配置可视化,用户可以通过直观的图形界面设计和管理网络拓扑
连通性检测
自动检测系统内组件间的连通性,确保网络配置正确无误
性能和可扩展性:
高性能:
负载均衡 (多路径)
多路径技术支持
在iSCSI IPSAN环境中,主机与存储设备通过多路径连接(如光纤交换机或多网卡与IP),形成了多对多的连接关系。这种机制允许主机通过不同的路径访问存储,确保在单一路径或节点故障时,自动切换到其他可用路径,保证业务连续性
自动切换与均衡
当某个存储节点或I/O路径故障时,客户端自动切换到其他正常节点和路径
智能缓存
数据类型感知
能够识别存储系统中的不同数据类型(如数据库、ERP、VDI等),并根据数据类型自动调整缓存策略,优化资源利用与I/O性能
多级缓存加速
实现内存缓存和闪存缓存的两级机制。内存缓存用于频繁访问的数据,加速读取;闪存缓存支持读写加速,并利用闪存的保电特性,允许数据快速写入闪存后即时确认写操作成功,后续再异步处理去重和合并,提高写入效率
分布式缓存
缓存资源均匀分布在各节点上,结合SSD用作写缓存和HDD的组合,确保即使使用低成本硬盘也能获得高性能
弹性伸缩:
弹性扩展 (在线扩展、全局负载均衡)
在线扩展
新增节点的计算和存储资源只需简单加入现有网络并通过图形控制台操作即可立即生效,无需停机,无缝扩展
全局自动负载均衡
块存储采用DHT(分布式哈希表)机制,确保数据的I/O操作均衡分布在不同节点和硬盘上,避免热点,实现全局负载均衡
DHT 分布式哈希算法
去中心化数据管理
通过DHT技术,数据在集群中被高效组织,哈希空间被划分为多个分区并映射到所有磁盘上,每个磁盘负责的哈希分片数量一致。这种算法支持快速定位数据,不受文件数量增加的影响,提高了海量文件访问的效率
数据副本在线转换
动态副本策略
允许用户根据业务需求在线调整存储冗余策略,从2副本到3副本,无需中断业务
系统可靠性:
数据可靠性:
块存储集群可靠性
Zookeeper
提供选主仲裁服务,确保元数据管理的一致性,同时存储系统初始化的元数据信息,如硬盘与分区的映射关系
MDC(元数据控制软件)
实现分布式集群的状态控制,通过Zookeeper选举主MDC,监控其他MDC状态,自动处理故障MDC,确保元数据访问的高可用性
OSD(对象存储设备服务)
采用主备模式,实时监控OSD状态,当主OSD故障时自动切换至备OSD,保证业务连续性。支持磁盘/SSD的灵活替换,提升系统可靠性
数据一致性
强一致性复制
所有副本数据写入成功后才确认写操作完成,保证从任一副本读取的数据都相同
读修复
在读取数据失败时,自动从其他健康副本获取数据并修复错误副本,维护副本间的一致性
数据完整性保护(DIF)
通过实时端到端校验、周期性后台校验和实时纠错自愈机制,防止静默数据破坏,确保数据的完整性和准确性
数据冗余保护 (多副本、EC)
多副本
支持2副本和3副本策略,自动在不同节点和硬盘上分布数据副本,提高数据可靠性
EC(Erasure Code)
提供更高利用率的数据冗余方式,如4+2、6+2、8+2等配比,支持数据块的快速重建
快速数据重建
在硬盘或节点故障时,自动并行启动数据修复流程,利用集群内其他节点的副本并行重建数据,减少单点重建压力,缩短重建时间,最小化对上层业务的影响
硬件可靠性:
高可靠自研硬件
系统冗余设计 (硬盘、电源、风扇、网络)
持热插拔SAS/SATA/NVMe硬盘,RAID1保护,双电源1+1冗余,风扇N+1冗余,以及iBMC直连管理接口
FPC (Failure Prediction and Correction)功能
预测内存故障并实施自愈隔离,防止故障影响业务运行
系统亚健康增强:
节点亚健康检测与处理
通过时延信息定位亚健康节点,隔离受影响的OSD,待问题解决后重新加入集群
网络亚健康检测与处理
监测网络性能下降,如丢包、延迟,自动进行网口切换或节点隔离
介质亚健康检测与处理
定期检测存储介质的SMART信息,识别访问速度降低的硬盘,隔离并修复,保证数据访问性能
系统安全:
系统安全威胁:
外部网络威胁
IP攻击
防御传统网络攻击,如端口扫描、IP地址欺骗、Land攻击、IP选项攻击和IP分片报文攻击等
软件漏洞
针对操作系统与第三方软件中发现的漏洞,如缓冲区溢出、滥用特权操作、未经过完整性检查的代码下载等,进行防范
病毒等恶意软件
防范病毒、木马、蠕虫等通过网络传播的恶意软件,保护系统免受感染
内部网络威胁 (内部攻击、恶意插件、移动设备等)
内部攻击与恶意插件
应对ARP欺骗、恶意插件滥用等问题,防止内部主机被用作“肉鸡”或发起DDoS攻击
移动设备安全
控制移动设备接入,防止携带病毒或木马的设备威胁内网安全
补丁与病毒库更新
确保操作系统、数据库、应用软件及时更新,防止因未更新导致的安全漏洞被利用
非法外联与数据泄露
限制非法外联,防止内部数据通过不安全的网络访问途径泄露
总体安全框架:
网络安全 (平面隔离)
业务平面
提供用户业务通道,隔离业务流量与其他通信,确保业务应用安全
存储平面
通过存储前端和后端平面分离,确保虚拟机访问存储资源时的安全性
管理平面
负责系统的管理维护,与业务和存储平面隔离,确保管理操作的安全
平面隔离
三个平面相互独立,减少攻击面,提高网络安全性
应用安全
权限管理
实施“三员分立”策略,包括系统管理员、安全管理员、安全审计员,确保不同用户拥有合适的权限
Web安全
自动将HTTP请求转换为HTTPS,防止跨站脚本攻击、SQL注入、跨站请求伪造等,同时隐藏敏感信息,限制文件操作,强化URL访问控制,并使用验证码保护登录页面
数据库加固
通过访问源控制、最小权限原则、目录与敏感文件保护、连接数限制等措施加强数据库的安全
日志管理
限制对日志的修改和删除权限,确保日志数据的完整性和可用性
主机安全 (操作系统加固)
对Linux操作系统进行加固,关闭不必要的服务(如Telnet、FTP),强化SSH服务,严格控制文件和目录访问权限,实施用户密码管理,记录操作日志,检测系统异常
数据安全 (数据分片、敏感数据加密)
数据分片存储
数据自动分片并分散存储于不同节点,增强数据保护
敏感数据加密
用户敏感信息通过AES-256或SHA-256算法加密存储,确保数据隐私
0 条评论
下一页
为你推荐
查看更多