登录免费注册

首页  流程图  详情

MapReduce工作机制详解

2020-04-17 16:56:26   0  举报





MapReduce工作机制详解

hadoop

MapReduce

MapReduce hadoop 执行流程

作者其他创作

大纲/内容

最终输出的结果文件分区且排序

溢出组件

20%

RecordReader（抽象类）

InputFormat

MapOutputCollect

调用组件

/wordCount/output/part-r-0000

WordCountReducer

MapReduce工作机制详解

partition0

key:行偏移量value:行内容

ReduceTask2

读取数据

ReduceTask1

partition2

partition1

split0

环型缓冲区默认100M

MrAppMaster

有序的文件，并且都是partition0的数据

溢出比80%

split1

有序的文件，并且都是partition2的数据

WordCountMapper

RecordWriter（抽象类）默认实现：TextRecordReader

有序的文件，并且都是partition1的数据

OutPutFormat

分区partition溢出到磁盘文件，分区且排序

Spiller

+ spill()

MapTask

HDFS

自己去maptask上的输出结果文件中拉取属于自己分区（分区0）的数（http下载）据

RecordReader（抽象类）默认实现：LIneRecordReader

split2

ReduceTask0

指挥reduceTask到哪个maptask获取数据

MapReduce工作机制详解

 收藏

立即使用

MapReduce工作机制详解

Secondary NameNode 工作流程

 收藏

立即使用

Secondary NameNode 工作流程

 收藏

立即使用

HDFS读数据步骤图

 收藏

立即使用

HDFS写数据步骤图

职业：本科













评论

0 条评论

下一页

为你推荐

查看更多



mapreduce_local machine

mapreduce_local machine

MapReduce机制示意图

MapReduce算法调用流程图

MapReduce算法调用流程图

信息复制机制

复盘流程详解知识地图

系统服务调用详解

4、Spring详解