走近大数据之Hive进阶（二、Hive的数据查询）

一、简单查询和fetch task

1、Hive查询的基本语法

走近大数据之Hive进阶（二、Hive的数据查询）

语法跟sql语法基本相似

SELECT * FROM user 与 SELECT name, gender FROM user的区别？

SELECT *全表扫描不会开启MapReduce作业，SELECT name, gender 会开启MapReduce作业查询想要的数据。（下面会介绍怎样不开启MapReduce作业）

nvl(A,B)函数：当A为空时取B

2、简单查询的Fetch Task功能

走近大数据之Hive进阶（二、Hive的数据查询）

前面两种只能在本次连接中生效，要永久生效需要修改配置文件，修改如下图

走近大数据之Hive进阶（二、Hive的数据查询）

二、在查询中使用过滤

1、where条件语法跟sql类似，如果需要查询含下划线_的记录，需要转义字符

走近大数据之Hive进阶（二、Hive的数据查询）

2、使用explain查询sql的执行计划，阅读顺序：从下往上，从右往左

走近大数据之Hive进阶（二、Hive的数据查询）

1、order by语句进行排序：排序属于高级操作，一定开启mapreduce作业（及前面的Fetch Task功能设置对order by是无效的）

走近大数据之Hive进阶（二、Hive的数据查询）

2、order by 后面可以跟: 列名，列的表达式，列的别名，序号

设置排序编号：

set hive.groupby.orderby.position.alias=true //默认为false

走近大数据之Hive进阶（二、Hive的数据查询）