Hive初探

一、什么是Hive

       Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射成一张表,并提供类SQL查询功能。  

        ##构建在Hadoop上的数据仓库

                 使用HQL作为查询接口

                 使用HDFS存储;

                 使用MapReduce计算

        ##本质是:将HQL转换成MapReduce程序

        ##HQL的核心是Engine。

      Hive初探

     Hive初探

二、Hive 在生态系统中的位置

Hive初探

三、Hive架构

Hive初探

Hive初探

Hive初探

四、Hive的优点和使用场景

Hive初探