Spark On Yarn运行机制图
2016-03-01 22:18:03 6 举报
Spark On Yarn是一种运行模式,它允许Spark应用程序在Hadoop YARN集群上运行。在这种模式下,Spark将任务提交给YARN的资源管理器(ResourceManager),然后由资源管理器分配资源并启动执行器(Executor)来执行任务。Spark On Yarn支持多种调度策略,包括FIFO、FAIR和CAP等。此外,它还支持多种存储级别,包括本地磁盘、HDFS和云存储等。总之,Spark On Yarn提供了一种灵活且可扩展的方式来运行Spark应用程序。
作者其他创作
大纲/内容
Node Manager
ResourceManager
Container
Client
e. 请求分配具体资源
App Mstr
d. 分配具体资源的元数据信息
Node 4
Node 2
b.定时汇报节点资源使用情况
f. 启动Container进程
c. 指定启动进程
Node 1
Node 3
a. 提交应用程序
0 条评论
下一页