spark
2015-11-10 15:15:36 7 举报
Spark是一个开源的大数据处理框架,它提供了一个快速、通用和易于使用的数据处理引擎。Spark基于内存计算,可以有效地处理大规模数据集,支持多种数据源和数据格式,包括HDFS、Cassandra、HBase等。Spark还提供了丰富的API和工具,如Spark SQL、Spark Streaming、MLlib等,可以帮助用户进行数据分析、机器学习和实时处理等任务。Spark具有高可扩展性和容错性,可以在集群环境下运行,并且可以与其他大数据生态系统(如Hadoop、Hive等)无缝集成。总之,Spark是一个强大的大数据处理工具,可以帮助用户快速高效地处理海量数据。
作者其他创作
大纲/内容
图排序、聚类、属性...算法
管理界面
数据导入
分布式文件存储系统
并行非图挖掘引擎
系统管理
并行计算层
信用评估方法算法集
数据转换
Spark计算引擎
GraphX计算引擎
并行图算法集
数据挖掘界面
个人展示、信用变化、信用查询
KNN、SVM、Naive Bayes、神经网络...
并行图挖掘引擎
数据管理
UI展示层
挖掘算法层
数据存储层
数据存储
ETL、ML...算法
并行非图算法集
信用评估逻辑层
0 条评论
回复 删除
下一页