大数据生态圈
2021-03-29 15:58:37 4 举报
大数据生态圈,大数据技术栈
作者其他创作
大纲/内容
TiDB(分布式关系型数据库)
CDH(安装、部署、配置和管理工具)
DataX(数据库间ETL工具)
Kafka(分布式发布订阅消息系统)
RHadoop(R和Hadoop接口工具)
Sqoop(数据库间ETL工具)
YARN(集群资源管理和调度系统)
Mesos(分布式资源管理框架)
Kudu(分布式列式存储数据库)
HBase(分布式实时列式存储数据库)
Spark(分布式内存计算(实时)框架)
Storm(流式实时计算框架)
Spark GraphX(Spark图计算)
Nutch(数据搜索引擎应用)
Pig(数据流式处理数据仓库系统)
Zookeeper(分布式协调服务系统)
Oozie(作业流调度系统)
Hive(HiveQL数据仓库系统)
Spark Mlib(spark机器学习算法库)
Shark(大数据分析查询系统)
MapReduce(分布式离线计算框架)
Flume(分布式日志采集工具)
HDFS(分布式文件存储系统)
Flink(分布式实时流处理框架)
Impala(大数据分析查询系统)
Spark Steaming(流处理工具)
Hadoop Streaming(编程脚本兼容工具)
Hue(图形化数据查询监控管理工具平台)
0 条评论
下一页