impala简介

impala 是运行于现有Hadoop基础设施上的实时互动SQL查询引擎,从而使hadoop  hbase的数据支持实时查询,
这意味着Impala为Hadoop打开了通向关系型数据库和传统商业智能工具的大门(后两者基于SQL查询)。
是Cloudera公司主导开发的新型查询系统.

传统hive仅支持30%的sql,而且是转换为mr,效率较低。


impala组成部分:  1 Impala实时查询引擎,采用Apache开源授权方式,Hadoop用户可以单独使用这个引擎.
Impala不再使用缓慢的 Hive+MapReduce批处理,
而是通过与商用并行关系数据库中类似的分布式查询引擎(由Query Planner、Query Coordinator和Query Exec Engine三部分组成),
可以直接从HDFS或者HBase中用SELECT、JOIN和统计函数查询数据,从而大大降低了延迟。

结构图:



 

猜你喜欢

转载自chengjianxiaoxue.iteye.com/blog/2226809