Hive知识全解

Hive的三种模式

  • Local模式:连接到一个In-Memory的数据库Derby,一般用于UnitTest。
    Hive知识全解
  • 单用户模式:通过网络连接到一个数据库中,最常使用到的模式。
    Hive知识全解
  • 多用户模式:远程服务器模式,用于非java客户端访问元数据(metastore),在服务器端启动metastoreServer,客户端利用thift协议通过metastoreServer访问元数据库。
    Hive知识全解

Hive的架构

Hive知识全解

  • 用户接口主要有三个,Cli,Client,WebGUI,其中最常用到的就是Cli,Cli启动的时候会同时会启动一个hive副本,client是hive客户端,用户连接到hiveServer,在启动client模式的时候,需要指出hiveServer所在的节点,并且在该节点启动hiveServer,WUI试通过浏览器也能访问Hive。
    ——Hive将元数据存储在数据库表中,如mysql,derby,hive中元数据包含表的名字,表的列和分区及其属性,表的属性,表的数据所在目录等,数据库中并不存储Hive的记录。
    ——Hive数据存储在hdfs中,大部分数据查询,计算由mapreduce完成(包含*的查询)