RDD
2017-03-20 15:51:55 0 举报
登录查看完整内容
RDD(Resilient Distributed Datasets)是Apache Spark中的一个核心概念,它是一个不可变的、分布式的数据集合。每个RDD都被分为多个分区,这些分区运行在集群的不同节点上。RDD提供了两种操作:转换操作和行动操作。转换操作创建一个新的RDD,而行动操作对RDD进行计算并返回结果。RDD具有容错性,如果某个节点失败,Spark会自动重新计算该节点上的数据。此外,RDD还支持并行处理和内存计算,使得大规模数据处理变得高效和快速。
作者其他创作
大纲/内容
阿里云
处罚管理
人员招聘和考培
任务追踪
审核管理
合规滥发
审核任务
聚合/拆分
生成任务
......
生产管理
.....
客户供、运营、供应商
监控预警
风险点
质检
底层题库
决策树
SLA管理
处罚中心
HR、OM、培训师
离线链路
禁限售
业务流程
质检员、小二
生产
用户角色
数仓和BI支持
PM、GR、客户
外包中台
APP管理
口碑
线下培训
绩效模型
项目立项
算法节点
消息处理
智能分发
钉钉
任务分发
任务调度
淘宝
用户管理
业务接入
申诉管理
咸鱼
生产计划
业务分解
人员准备
视频/直播
审查范围
导入
假货商品
方案确认
招聘管理
系统保障
任务审核
批次管理
Wing预警
优酷
成本分析
项目交付和结算
绩效管理
供应商看板
平台治理
排查平台
业务/场地
阿里健康
菜鸟
RCP基础平台
质检管理
外部依赖
考拉
审核
质检员
应用管理
项目结算
保证金治理
人员招聘
HRO场地租赁装修
BPO供应商测试安全评估
未经准入
MTEE
闲鱼品质
侵权商品
其他
仲裁管理
样本库
高德短视频
盒马
风控事件
PISA
算法打标
HCM系统
结算线上化
阿里云网页
OM、主管、组长
绩效数据
跨境业务
1688
饿了么
风险分类
考试
RCP聚合能力
人员排班
天猫
业务准备期
合规准入
SLA看板
闲鱼
基地看板
0 条评论
回复 删除
下一页