SparkOnYarn

2017-04-04 20:55:54   0  举报





仅支持查看

SparkOnYarn是Apache Spark在YARN（Yet Another Resource Negotiator）集群上运行的实现。它允许用户在Hadoop YARN集群上运行Spark应用程序，充分利用YARN的资源管理和调度能力。通过SparkOnYarn，用户可以将Spark与现有的Hadoop生态系统无缝集成，实现数据处理和分析的统一平台。此外，SparkOnYarn还支持多种数据源和格式，如HDFS、Cassandra、HBase等，为用户提供了丰富的数据处理功能。总之，SparkOnYarn是一个强大的大数据处理工具，能够帮助用户更高效地处理和分析海量数据。

作者其他创作

大纲/内容

Container

Executor

Resource Manager

Application Master

launch

start

Node Manager

YarnClusterScheduler

Yarn

request