参考文章:
https://blog.csdn.net/lifei128/article/details/82393539
Hive支持多表插入,可以在同一个查询中使用多个insert子句,这样的好处是我们只需要扫描一遍源表就可以生成多个不相交的输出!
例子 :
from test1
insert overwrite table test2
partition (age)
select name,address,school,age
insert overwrite table test3
select name,address
多表插入的关键点在于将所要执行查询的表语句 "from 表名",放在最开头位置。
注意 :
这是一个优化,可以减少表的扫描,从而减少 JOB 中 MR的 STAGE 数量,达到优化的目的。