首页  流程图  详情

spark流程概念知识相关图

2022-08-19 11:01:18   1  举报





spark运行流程图，RDD处理流程图，字符流图，字节流图，缓冲区图，wordcount处理流程图等等·

流程梳理

分析图

学习笔记

读书笔记

作者其他创作

大纲/内容

省份2，（（广告，99），（广告，88），（广告，77））

数据源

数据流

map

groupByKey

用省份分组

task

file

executor

spark SQL

DataFrame

action算子

flatMap

person

Job Scheduler

flatMMap

reduceByKey--ShuffledRDD

统计每个省份每个广告被点击数排行

缓冲流

time1

reduceByKey

spark处理

int

time3

sparkStreaming 整体构架图

data2

时间省份城市用户广告

省份，（广告，sum）

FileInputStream

RDD_reduceByKey

taskXX

ResultStage

贵

cache

wordcount

InputStream in = new BufferedInputStream(new FileInputStream\"path\")int i = 1while((i = in.read()) != 1){println(i);}

省份，（（广告，sum），（广告，sum），（广告，sum））

string

driver

三者之间的转换关系

sparkStreaming

分组聚合统计

hello worldhello scala

name

数据保存

work node

executor启动

块ID

创建taskSet

数据

打印

RDD3依赖RDD2，RDD2依赖RDD1

spark GraphX

database

hello

data3

RDD

计时

Buff

map--MapPartitionsRDD

data1

集群管理

提取数据&格式转换

main函数

备份数据到另一·节点

（省份，广告），sum

age

scala

Master

spark核心模块

collect

textfile

RDD持久化

spark Driver

spark提交任务流程

RDD1

BufferedReader

sparkStreaming Driver

textFile

Twitter

字节流

spark core

textFlieread

提交任务

复制到另一个BM的块

sparkContext

fileXXXX

（省份，广告），1

输出结果

HDFS/S3

省份1，（（广告，99），（广告，88），（广告，77））

cluster manager

RDD_map

kafka

streamingContext

stage划分

hello world

time2

BufferedInputStream

spark MLlib

DataSet

Reader in = new BufferedReader(new InputStreamReader(new FileInputStream(\"path\

TaskPool

DStream

textfile--HadoopRDD

字符流

Block Manager

hello scala

Executor

receiver

dashboards

spark streaming

RDD2

RDD依赖关系

InputStream in = new FileInputStream(\"path\")int i = 1while((i = in.read()) != 1){println(i);}

运行架构

flatMap--MapPartitionsRDD

runJob

getBlocksOrBatch

ShuffleMapStage

Receiver Tracker

JobSet

worker

省份3，（（广告，99），（广告，88），（广告，77））

程序

获取原始数据

world

一般情况

flume

执行原理

HDFS

data blocks

RDD3

Receiver

SparkContext

sparkStreaming 构架图

格式转换

fllatMap

InputStreamReader

排序

kinesis

RDD的Lineage会记录RDD的元数据信息和转换行为

Job Generator

 收藏

立即使用

spark流程概念知识相关图

 收藏

立即使用

hive/kafka/zookeeper/flume概念流程图等等

 收藏

立即使用

注册登录时序图，spring+mysql+spark+flume+kafka系统设计图等等

 收藏

立即使用

选课系统用户角色权限关系图

PO_671487

职业：暂无

去主页





0 条评论

下一页

为你推荐

查看更多

