实时数仓
2024-12-09 16:16:03 0 举报
实时数仓是一种数据处理和分析系统,能够快速处理大量的实时数据流,如网络点击、社交媒体互动和物联网设备产生的数据。它支持实时数据分析和决策制定,帮助企业优化运营和提升业务表现。与离线数仓相比,实时数仓能够提供更快速、更具时效性的业务洞察。在实施过程中,实时数仓需要处理数据的实时流入、清洗、转换、存储和分析等环节,并确保数据处理的准确性和一致性。
作者其他创作
大纲/内容
账号归因
SLS
清洗实时数据
Flink
落地实时数据
实时
离线
Adjust日志
分时区ltid分日设备表account分日账号表apg_account分日单包表
刷数据
包含游戏事件
DWD-Topic层
双写
同实时、中间存储在HDFS
用户表
归因结果日志
分用户所有标签Bitmap
落地
installregisterloginrole_createrole_levelupcity_levelupclick
根据事件表计算
platform_game_purchaseh充值
platform_game_rolelogin登录
DWD-Clean层
spark
AF日志
设备用户表单包账号用户表跨包用户表
归因表(ltid归因)
实时清洗成每个主题
服务端日志
platform_game_acccreate创号
设备归因
清洗历史数据
iceberg
ODS层
用户所有活跃事件Bitmap视图
0 条评论
下一页
为你推荐
查看更多