Hive SQL中join的使用
Hive SQL中的join有以下几种常用的方式:
1.left (outer) join,以join的左边表为基础输出,在结果表中满足on的条件的记录中增加右边表的字段值,以上图左一所示:
2. right (outer) join, 以join的右边表为基础输出,在结果表中满足on的条件的记录中增加左边表的字段值,以上图右一所示:
3.(inner) join, 结果表输出同时满足on的条件的记录及A.B字段,如中间图所示。
4.cross join, 即笛卡尔积,一般不怎么用。
上图中其他场景均为使用where选择之后的应用,本处不做讨论,在使用join的过程中需要注意由于重复记录或者多条记录满足表的join的条件所导致的数据膨胀问题。