Hadoop生态
2019-12-09 10:58:06 0 举报
AI智能生成
Hadoop学习路线图
作者其他创作
大纲/内容
MapReduce分布式计算模型
MapReduce架构设计
MapReduce运行原理
深入理解MapReduce的Shuffle过程
Partition
数据倾斜的解析与管理
MapReduce高级使用之Combiner
MapReduce InputFromat多场景使用
MapReduce调优
WordCount实战案例
Hive架构与介绍
Hive介绍
数据仓库概念
数据仓库与数据库区别
Hive架构原理
使用MySQL管理Hive元数据
Hive的使用场景
Hive的优缺点
Hive的执行引擎
Hive操作符
Hive语法解析
Hive DDL
Hive基础数据类型
Hive复杂数据类型
Hive数据类型转换
Hive创建数据库
HIve创建表的三种方式
Hive创建管理表
Hive创建外部表
Hive数据读取规则SerDe
Hive静态分区管理
Hive动态分区管理
Hive删除表
Hive修改表
Hive分桶表管理
Hive视图
Hive索引
HBase
HBase介绍
NoSQL介绍
HBase特点
HBase存储数据结构
HBase数据模型
HBase表结构介绍
HBase架构图
HBase角色定位
HBase内存结构介绍
HBase写数据流程
HBase读数据流程
HBase命令
HBase创建表
HBase删除表
HBase插入数据
HBase更新数据
HBase删除数据
HBase获取一条数据
HBase获取某个范围的数据
HBase进阶
Region分裂与合并
Region分组
限流
集成MapReduce
HBase之bulk load
HBase snapshot导出
HBase之列族
HBase调优
Flume架构
Flume日志收集工具
Flume agent架构
Flume组件
Flume集群讲解
Flume不同架构介绍
Flume安装
Flume配置信息
Flume单台安装
Flume集群安装
Flume高可用讲解
Flume Source
Spooling directory source
Kafca Source
自定义source
HDFS分布式文件系统
HDFS架构设计
HDFS的角色以及作用
NameNode
DataNode
SecondaryNode
HDFS的操作与命令
读写流程分析
文件压缩
文件快照
机架感知
NameNode高可用、联邦
负载均衡
HDFS3新特性
源码分析
Yarn资源调度系统
Yarn结构设计核心原理
Yarn核心运行机制
Yarn的任务调度策略
公平调度
延迟调度
容量调度
MRJob提交流程的源码深度刨析
Hive DML
Hive全表查询
Hive条件查询
Hive分组查询
Hive运算符
Hive内置函数
Hive表连接
Hive排序方式
Hive嵌套查询
Hive行转列
Hive高级
Hive UDF
Hive UDAF
Hive优化
Hive高级调优
Hive JDBC操作
Flume Sink
HDFS Sink
HBase sink
Kafka sink
自定义 sink
Sqoop架构介绍
Sqoop简介
ETL讲解
Sqoop导入
Sqoop导入
Sqoop导出
Sqoop安装
Sqoop配置
Sqoop操作
Sqoop导入数据至Hive
Sqoop导出数据到MySQL
导出配置
HDFS配置
HBase配置
数据库配置
ZooKeeper
分布式协调框架
ZooKeeper背景与介绍
分布式ZooKeeper环境与安装
Java客户端操作
深入理解paxos协议与raft协议
分布式锁
主从选举
注册中心
伪分布式
完全分布式
高可用HA应用案例分析
Impala交互式查询使用
Impala背景介绍
架构原理
优缺点以及与Hive的异同
Impala查询Hive中的数据
Impala设计原则
SQL语句和内置函数
Impala支持的文件格式
Impala的JDBC操作
0 条评论
下一页