数仓分层
2025-03-01 09:15:55 0 举报
在一个数仓分层架构中,数据按照其在企业中的用途被组织和抽象化。最基础的层次是操作型数据存储层(ODS),它负责暂存细节数据,通常为近实时或实时更新的数据。之上是数据仓库层,按照主题域分为维度模型层和事实模型层。在这些层次中,数据被转换为适应不同分析需求的形式。数据仓库层依赖ODS层的数据进行汇总和整合,通常采用星型或雪花模式进行数据建模,以支持报表和分析任务。然后是数据集市层,它是数据仓库层的数据子集,专为特定业务用户群体或特定决策制定任务服务。最后,有些架构还包含数据应用层,其中包含了面向业务的应用程序或服务,如ETL工具、数据挖掘分析等。数据在这些层次间的流动和转换,为决策支持和业务智能分析提供有序、高效的数据服务。
作者其他创作
大纲/内容
ADS Application Data Service
1. 对 ODS 层数据进行一定清洗、多源融合、补全、维度退化、编码后,形成事实数据明细层。2. 提供业务系统明细数据的长期沉淀,为分析需求提供历史数据支撑。为 DWS层 和 ADS 层提供复用和关联计算,减少数据扫描。
DWS Data Warehouse Service
1. 面向业务定制的应用数据层;2. 对 DWS 层数据整合汇总成分析某一个业务领域的服务数据,表现为业务主题宽表,服务于特定场景,复用性不强,比如提供给 BI 报表、数据查询、用户画像等业务场景应用。
1. 汇总数据层+主题宽表;2. 在 DWD 层基础上按照常用业务主题进行轻度汇总,如主题域订单、用户、区域、数据来源汇总,形成的某个业务主题的明细数据宽表,生成的字段较多,方便业务查询、OLAP等。3. 一般一张表会涵盖比较多的业务内容。
DIMDimension
DWD Data Warehouse Detail
ODS Operational Data Store
1. 原始数据层,不进行数据加工,减少对业务系统的影响。2. 是将数据引入数仓,记录基础数据历史变化、数据备份和回溯的依据
0 条评论
下一页