kylin数据流程
2016-12-24 14:25:30 0 举报
Kylin是一个开源的分布式分析引擎,提供Hadoop之上的SQL查询接口及多维分析(OLAP)能力以支持超大规模数据。它的主要数据流程包括:首先,用户通过Kylin的Web界面或者API提交查询请求;然后,Kylin将查询请求转换为Hadoop任务,并将任务分发到各个Hadoop节点上执行;接着,各个节点上的MapReduce任务对原始数据进行计算,生成预聚合结果;最后,Kylin将这些预聚合结果进一步汇总和排序,返回给用户。这个过程中,Kylin会利用Hadoop的存储和计算能力,同时通过优化算法提高查询性能。