走近大数据之Hive进阶(二、Hive的数据查询)

走近大数据之Hive进阶(二、Hive的数据查询)

 

一、简单查询和fetch task

1、Hive查询的基本语法

走近大数据之Hive进阶(二、Hive的数据查询)

 

语法跟sql语法基本相似

SELECT * FROM user 与 SELECT name, gender FROM user的区别?

SELECT *全表扫描不会开启MapReduce作业,SELECT name, gender 会开启MapReduce作业查询想要的数据。(下面会介绍怎样不开启MapReduce作业)

nvl(A,B)函数:当A为空时取B

2、简单查询的Fetch Task功能

走近大数据之Hive进阶(二、Hive的数据查询)

 

走近大数据之Hive进阶(二、Hive的数据查询)

 

走近大数据之Hive进阶(二、Hive的数据查询)

 

前面两种只能在本次连接中生效,要永久生效需要修改配置文件,修改如下图

走近大数据之Hive进阶(二、Hive的数据查询)

 

走近大数据之Hive进阶(二、Hive的数据查询)

 

二、在查询中使用过滤

1、where条件语法跟sql类似,如果需要查询含下划线_的记录,需要转义字符

走近大数据之Hive进阶(二、Hive的数据查询)

 

2、使用explain查询sql的执行计划,阅读顺序:从下往上,从右往左

走近大数据之Hive进阶(二、Hive的数据查询)

 

三、在查询中使用排序

1、order by语句进行排序:排序属于高级操作,一定开启mapreduce作业(及前面的Fetch Task功能设置对order by是无效的)

走近大数据之Hive进阶(二、Hive的数据查询)

 

2、order by 后面可以跟: 列名, 列的表达式, 列的别名, 序号

设置排序编号:

set hive.groupby.orderby.position.alias=true //默认为false

走近大数据之Hive进阶(二、Hive的数据查询)