SparkOnYarn
2017-04-04 20:55:54 0 举报
SparkOnYarn是Apache Spark在YARN(Yet Another Resource Negotiator)集群上运行的实现。它允许用户在Hadoop YARN集群上运行Spark应用程序,充分利用YARN的资源管理和调度能力。通过SparkOnYarn,用户可以将Spark与现有的Hadoop生态系统无缝集成,实现数据处理和分析的统一平台。此外,SparkOnYarn还支持多种数据源和格式,如HDFS、Cassandra、HBase等,为用户提供了丰富的数据处理功能。总之,SparkOnYarn是一个强大的大数据处理工具,能够帮助用户更高效地处理和分析海量数据。
作者其他创作
大纲/内容
Container
Executor
Resource Manager
Application Master
launch
start
Node Manager
YarnClusterScheduler
Yarn
request
0 条评论
下一页
为你推荐
查看更多
抱歉,暂无相关内容