Hive的体系结构

Hive的元数据

Hive将元数据存储在数据库中 支持

  • derby(默认)
  • mysql
  • oracle(没人用)

什么是元数据

Hive的元数据包括:

  • 表的名字
  • 表的列和分区及其属性
  • 表的属性(是否为外部表)
  • 表的数据所在的目录等
    Hive的体系结构

HQL语句在hive中进行查询

HQL的执行过程

  • 解释器
  • 编译器
  • 优化器

共同完成对HQL语句从词法分析、语法分析、编译、优化以及**查询计划(Plan)**的生成
生成的Paln存储在HDFS中,并随后有MapReduce进行调用

Hive的体系结构

Hive的体系结构

Hive的体系结构

Hive的安装模式

嵌入模式

  • 元数据存储在derby中
  • 只允许一个链接
  • 多用于Demo
    Hive的体系结构

本地模式

  • 元数据通常存储在musql
  • mysql数据与Hive运行在同一台物理机器中
  • 多用与开发与测试

远程模式

  • Hive与Mysql运行在不同的物理机器上
    Hive的体系结构