HBase
2016-03-01 16:10:14 3 举报
HBase是一个开源的、非关系型、分布式数据库,它是Apache软件基金会的Hadoop项目的一部分。HBase的设计目标是提供一个高可靠性、高性能、面向列、可伸缩的存储系统,用于存储大规模的结构化数据。HBase使用Hadoop的HDFS作为其底层存储系统,并提供了对大规模数据的随机读写能力。HBase的数据模型基于Google的Bigtable,它支持海量数据的存储和处理,适用于大数据分析和实时查询等场景。HBase的主要特点包括:分布式存储、自动故障转移、数据强一致性、支持多版本并发控制等。
作者其他创作
大纲/内容
MemStore
替换之前多个HFile
store
client
HMaster(备)
store一个列簇一个store
管理
HFile
逻辑视图(rowkey+列簇+列+value+timestamp 代表一个cell)rowKey 列簇 cf------------------------------------------------ 列a , 列b , 列c -------------------------------------------------row1 value1(timestamp1) value22(t2), value25(t3),row2 value2(t3)row3 value3(t4)
HLog3 预写日志
写入数据
列式:KV格式的列式存储多维:key由5个维度组成排序规则:依次排序rowkey升序列族:列来升序timestamp升序
MemStore2 写内存store
HLog
4 写hfile文件
HBase逻辑本质:列式多维稀疏排序Map
RegionServer
HDFS
稀疏
HDFS Client
管理元数据
zookeeper存储元数据
Region
HMaster
Map存储-----------------------Key value-----------------------row1+cf:a+put+t1 value1row1+cf:b+put+t3 value25row2+cf:b+put+t3 value2row3+cf:c+put+t4 value3
获取元数据
HFile定时合并机制
高可用主备切换
列式多维排序Map
BlockCache读缓存
0 条评论
回复 删除
下一页