Spark Streaming DStream Logical Model
2016-04-17 20:48:05 0 举报
Spark Streaming的DStream(Discretized Stream)是一个高级抽象,表示连续的数据流。它基于RDD(弹性分布式数据集)构建,能够处理来自各种数据源(如Kafka、Flume、HDFS等)的实时数据。DStream支持对数据进行转换操作(如map、filter和reduce),并允许用户定义窗口操作(如滑动窗口、会话窗口和增量窗口)。此外,DStream还支持输出到文件系统、数据库和其他数据接收器。总之,Spark Streaming的DStream为处理实时数据提供了一个强大且灵活的框架。
作者其他创作
大纲/内容
InputDStream(背后Receiver)
Data Stocket ServerPort
Socket编程:getInputStream不断的从远程Pull数据到Receiver中,转过来通过BloackManager进行存储
TransformationsDStream
OutputStreamForEachDStrem
Logical Model
0 条评论
回复 删除
下一页