首页  流程图  详情

hive-mr

2017-03-22 10:04:56   0  举报





仅支持查看

为你推荐

查看更多



Hive

555

MR2024082349784-实物补偿线上化（测试用例）

Hive-MR是Apache Hive中的一个模块，它实现了MapReduce编程模型，使得用户可以使用Hive进行大规模数据处理。Hive-MR将SQL查询转换为MapReduce任务，然后提交到Hadoop集群上执行。这种模式允许熟悉SQL的用户在无需编写复杂的MapReduce程序的情况下，利用Hadoop的强大计算能力处理海量数据。同时，Hive-MR还提供了一些优化策略，如谓词下推、列裁剪等，以提高查询性能。总的来说，Hive-MR为Hadoop生态系统提供了一个强大的SQL接口，使得数据分析和处理变得更加简单和高效。

作者其他创作

大纲/内容

Reduce Output Operator： Key: _col0 value: _col1

HDFS

destToWhereExpr: appid='animal_androidcncm_prod'ds='2015-08-17'

destToWhereExpr: num100

destToSelExpr: gid

TableScan：data_101

Group By Operator：Key: _col0 aggregations: count(VALUE._col0)

Filter Operator：_col1 100

QB2

nameToDest: TOK_TMP_FILE

select *** from raw_table.raw_ingamewhere ***group by ***

aliasToTabs: raw_data data_101

aliasToSubq : QB2

select *** fromraw_data.data_99where ***group by ***

QB1

destToAggregationExprs: count 1

destToGroupby: gid

select *** from raw_table.raw_user_daywhere ***group by ***

Select Operator：gid

 收藏

立即使用

hive-mr

小AAA

职业：暂无

去主页





0 条评论

回复删除



取消

下一页