大数据架构师学习路线
2023-08-31 15:46:11 23 举报
AI智能生成
大数据学习路线图,欢迎大家共同协作,一起学习
作者其他创作
大纲/内容
数据采集技术体系篇
离线分布式采集技术深度剖析
数据采集系统Sqoop
数据采集系统DataX
数据采集系统Kettle
实时分布式采集技术深度剖析
数据采集系统Flume
数据采集系统Maxwell
数据采集系统Canal
数据采集系统NiFi
中间件
分布式协调调度Zookeeper
分布式缓存Redis
消息系统生态
Kafka
Pulsar
数据分析系统ELK Stack
分布式搜索引擎Elastic Search
分布式日志采集Logstash
可视化分析引擎Kibana
数据存储
HDFS
HBase
Hive
数据湖生态
Hudi
DeltaLack
IceBerg
数据处理
分布式计算引擎MapReduce源码级深度剖析
分布式计算引擎Spark源码级深度剖析
分布式计算引擎MapReduce源码级深度剖析
分布式计算引擎Flink源码级深度剖析
大数据PB级架构设计之OLAP生态体系
Kylin
Presto
Druid
Impala
Phoenix
Kudu
ClickHouse
ClickHouse应用场景
ClickHouse介绍
子主题
命令
数据类型
数据库引擎
表引擎
使用
临时表
视图
普通视图
物化视图
数据导入导出
API操作
可视化(普罗米修斯 + Granfana)
StarRocks
Doris
稳健架构设计体系
分布式离线数据仓库体系构建方法论
分布式离线数据仓库体系构建方法论
分布式数据治理技术体系深度剖析
数据治理管理
元数据管理Atlas
数据安全管理Ranger
数据安全管理Kerberos
信息化数据中台技术体系深度剖析
数据中台构建方法指导论
BI大数据可视化技术体系深度剖析
BI大数据可视化Hue
BI大数据可视化Superset
BI大屏可视化TCV
集群调度管理体系篇
分布式资源调度引擎Yarn底层深度剖析
分布式资源调度框架Yarn
分布式任务调度引擎技术体系深度剖析
任务流调度oozie
任务流调度Azkaban
任务流调度Airflow
大数据集群管理平台体系深度剖析
集群管理平台ClouderaManager
集群管理平台Ambari
数据挖掘体系
数据学习与数据挖掘算法体系深度剖析
多元线性回归算法
贝叶斯分类
KNN分类
Kmeans、Kmeans++
TF-IDF
逻辑回归分类
决策树
随机森林
项目架构设计体系篇
基于Kappa架构的Flink实时数仓综合平台
湖仓一体电商数据分析平台
商品推荐系统综合项目
收藏
0 条评论
下一页