RDD
2016-12-28 11:33:56 0 举报
登录查看完整内容
RDD,全称Resilient Distributed Datasets,是Apache Spark中的一个基本概念。它是一个不可变的、分布式的对象集合,每个RDD都被分为多个分区,这些分区运行在集群的不同节点上。RDD可以执行各种运算,如map、filter、reduce等,并且这些运算都是惰性的,只有在遇到行动操作(如count、collect)时才会真正执行。这种设计使得RDD能够有效地处理大规模数据,并且具有很高的容错性。如果某个分区的数据丢失,Spark可以通过计算该分区的依赖分区的数据来恢复它。此外,RDD还支持并行操作和持久化,可以在多次计算中重复使用,从而提高了效率。
作者其他创作
大纲/内容
No
买家确认收货
支付成功
是否如约发货
创建发货单
卖家确认合同
资金到账
是否继续订单
卖家起草合同/上传PI合同
支付预付款
订单关闭
纠纷入口打开
Yes
生成合同
卖家发货
订单完成
发起纠纷
是否符合完成条件
释放保前保障金
创建尾款单
创建预付款单
买家PI上传合同
释放保后保障金
0 条评论
回复 删除
下一页