rdd

2017-01-04 18:46:33 0 举报
仅支持查看
rdd
RDD,全称为Resilient Distributed Datasets,中文名为弹性分布式数据集。它是Apache Spark中的一个核心概念,是一个不可变的、可分区的数据集合,每个分区都被分布在集群的不同节点上。RDD提供了一种高度灵活的容错机制:数据被复制到多个节点上,所以即使某个节点发生故障,数据也不会丢失。此外,RDD还支持并行操作和丰富的操作类型,如map、filter、reduce等,使得大规模数据处理变得高效而简单。
作者其他创作
大纲/内容
评论
0 条评论
回复 删除
取消
回复
下一页