大数据BigData之hive的执行过程是怎么样的?(概括)

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/baidu_34122324/article/details/85083267

hive的执行过程,大体上是这样的:

  1. hive 客户端(一般是hive cli,入口类为CliDriver)把HQL翻译成MR执行计划(Operator树)并序列化到 plan.xml
  2. plan.xml 上传到hdfs上
  3. hive 客户端新起一进程,提交MapReduce程序,其入口类为ExecDriver,ExecDriver的Mapper会在setup阶段读取plan.xml,反序列化成Operator树结构,然后执行。

猜你喜欢

转载自blog.csdn.net/baidu_34122324/article/details/85083267