HIVE 知识导图
2022-04-29 09:32:22 0 举报
AI智能生成
HIVE 知识导图
作者其他创作
大纲/内容
数据仓库
特性
面向主题
数据归类
集成性
数据整合
非易失性
存量数据
时变性
周期性更新
OLAP
业务数据库(OLTP)
捕获数据
关注点是存量数据分析
分析数据
数据挖掘
分层架构
应用数据
报表
查询
分析
挖掘
数据仓库
聚合数据
多维数据模型
业务模型
数据细节
源数据
数据库
文档
日志
元数据管理
数据模型定义
数据映射配置
ETL
extract 抽取
transfer 转化
load 加载
HIVE
HSQL
类SQL
CURD
排序
order
全局
sort
reducer 级别
分组
group
分区
partition
Clusted
底层通过MapReduce实现
函数
内置函数
abs
avg
sum
自定义函数
UDF
UDAF
压缩
Map输出压缩
Reduce 结果压缩
Snappy压缩算法
存储格式
行式
TextFile
sequence
列式
orc
Parquet
调优
直接IO 读取文件
小任务本地执行
阶段并行运行
严格模式
分区带字段
排序带Limit
限制笛卡尔积
JVM重用
推测执行
收藏
收藏
0 条评论
下一页