spark-sql-catalyst
2017-03-06 10:39:46 0 举报
登录查看完整内容
Spark SQL Catalyst是Apache Spark中的一个核心组件,它负责将用户编写的SQL查询转换为可执行的物理计划。Catalyst提供了一个优化框架,用于处理各种查询优化任务,如谓词下推、列剪裁、常量折叠等。通过这些优化策略,Catalyst能够提高查询性能,减少资源消耗。此外,Catalyst还支持多种数据源,如Hive、Parquet、JSON等,使得用户可以方便地在Spark上进行数据处理和分析。总之,Spark SQL Catalyst是一个强大的查询优化引擎,为Spark SQL提供了高性能、可扩展的数据处理能力。
作者其他创作
大纲/内容
Filter isnotnull(id#82)
RDD操作
Project[id#79]
UnresolvedRelation `people`
Join Inner
LocalLimit10
Filter ((id#79 = id#82) && (gender#81 = Male))
Filter ((isnotnull(gender#81) && (gender#81 = Male)) && isnotnull(id#79))
Spark SQL Catalyst
SQL语句
GlobalLimit10
“编译器”
Filter (('people.id = 'score.id) && ('people.gender = Male))
UnresolvedRelation `score`
0 条评论
回复 删除
下一页