技术路线
2021-12-16 16:41:24 0 举报
AI智能生成
1
作者其他创作
大纲/内容
埋点指标设计
埋点的理解、上报时机与验证
埋点接入
埋点
数据仓库建设规范
Inmon数据仓库理论
Lambda架构建设方法
领域模型与主题域划分
数据仓库分层方法
数据仓库各层的建设方法论
数据仓库架构
kimballl维度建模基础理论
如何构造一致性维度与一致性事实
事实表与维表的建设原则
构建基础指标体系
结合业务的维度建模实践
其他建模的方法
数据仓库建模
规范执行监控
精准波动监控方法论
ETL规则监控
全流程对数监控
代码质量扫描
数据质量管理
数据知识管理方法
业务元数据管理(埋点,ODS层,数据仓库、应用层指标)
指标管理系统
技术元数据管理
技术运营方法论
元数据管理
质量分系统
存储资源治理方法
计算资源优化方法
数据治理
数据仓库
MapReduce工作流程与原理
Yarn资源管理原理
HDFS执行流程与文件操作命令
Hadoop
Hive工作原理与执行流程
Hive Cli的使用与所有命令了解
Hive DDL DML 操作及其对SQL的扩展
Hive 元数据库
Hive 存储文件格式与压缩
Hive MR数量与小文件处理
Hive数据类型与复合类型的使用
Hive UDF UDAF UDTF 的使用与开发
数据倾斜产生原因、shuffle原理、解决方法
Hive
Spark 工作原理与执行流程
RDD的深刻理解
Spark 命令行接口与submit接口
Spark任务的划分,执行计划、DAG的生成
Spark排错与WebUI的使用,常用参数的理解
Spark数据倾斜问题的解决,广播表,缓存表的使用
Spark
Flink流式处理框架技术原理
Flink 有状态计算执行流程
Flink Checkpoint与容错处理机制
Flink 时间、窗口、水位线控制
Flink SQL 全部语法的特点
Flink 自定义函数开发
Flink 流批一体化API理解
Flink
presto日常使用
presto语法特点
presto
sqoop日常使用
sqoop效率优化
sqoop
数据湖技术三剑客优缺点
流批一体化技术架构
Iceberg实现原理
数据湖技术
大数据技术
kafka技术架构与组件
kafka的原理,如何保证消息可靠
kafka命令操作,数据维护
kafka日常使用与问题排查
kafka
Kylin原理与剪枝优化
Kylin报表配置
OLAP模型设计
ClickHouse原理
ClickHouse常规使用
OLAP技术
Mysql常规使用
Mysql分区表的创建维护
Oracle常规使用
Oracle分区表与物化视图
PLSQL编程
Greenplum常规使用
数据库使用
各类图表的作用
图表配置
数据呈现技巧,不仅是图表
数据精准解读技巧
可视化工具的使用
可视化技术
Hbase常规使用
Hbase原理与操作
Redis常规使用
Redis原理与常用操作命令
MongoDB常规使用
NoSQL技术
报表配置系统
Adhoc系统
调度系统
数据查询系统
补录系统
埋点系统
监控系统
数据导入导出系统
SVN/GitLab
系统使用
Shell基本语法
Shell函数式编程
Shell处理数据文件
Base Shell
Java面向对象编程
Java简单程序编写
能阅读Java代码
Java
其它数据技术
商业模式画布
4P/4R模型
波特五力
...
竞品/业务分析
PESTEL
行业分析
业务分析/解决问题
指标拆解
参考系选择
权重计算
指标波动归因
控制变量+差异分析
根因判断
主因分析
因果推断问题
同环比
时序分解
可解释预测
RNN/GRU/LSTM
SARIMA/ARIMA
黑箱时序预测
业务指标预测
泛回归问题
特征分析
标签产出
概率分层
泛分类问题
osm模型
北极星指标拆解
AAARR
漏斗模型
海盗模型
Kmeans
RFM
聚类分析
分而治之
增长模型
其他个性化建模问题
DeepFM/CF/XGBT
精细化推荐
最优匹配问题
业务分析/发现问题
基本语法
表五大关联
表横竖转换
各类函数使用
窗口与分析函数
SQL
表格基本操作,筛选,排序等
数据透视表,透视图
Excel图表使用
Excel函数及公式
Excel
Linux日常使用命令
文件操作,管道、重定向等
VIM使用
Linux
Python语法
Python编程实践
Python数据科学包使用
Python
PPT母版与风格
PPT排版与美化
汇报型PPT制作技巧
PPT
通用技能
重要
非常重要
一般
技术路线
0 条评论
回复 删除
下一页