大数据生态系统
2020-07-31 14:02:26 2 举报
大数据生态系统
作者其他创作
大纲/内容
Spark MLlib(Spark 机器学习算法库)
Spark(分布式内存计算框架)
Zookeeper(分布式协作服务)
Tez(DAG计算)
Spark Streaming(Spark 流式计算微批处理框架)
HBase(实时分布式数据库)
Nutch(数据搜索引擎应用)
Zookeeper(分布式协调服务系统)
Sqoop(数据库ETL工具)
HBase(分布式实时列式存储数据库)
MapReduce(分布式离线计算框架)
Storm(流式实时计算框架)
Hive(数据仓库)
HadoopStreaming(编程脚本兼容工具)
SparkGraphX(Spark图计算)
Mahout(数据挖掘库)
HDFS(分布式文件系统)
Flume(分布式日志采集工具)
Shark(大数据分析查询系统)
MapReduce(分布式计算框架)
Ambari(安装部署和管理工具)
Mahout(Hadoop机器学习算法库)
Sqoop(数据库间的ETL工具)
HUE(图形化数据查询、监控管理工具平台)
大数据生态系统
Kafka(分布式消息系统)
Oozie(作业流调度系统)
RHadoop(R和Hadoop接口工具)
Pig(数据流处理)
YARN(集群资源管理和调度系统)
Hive(数据仓库系统)
Impala(大数据查询分析系统)
Flume(日志收集工具)
0 条评论
下一页