Hive的体系结构
Hive的元数据
Hive将元数据存储在数据库中 支持
- derby(默认)
- mysql
- oracle(没人用)
什么是元数据
Hive的元数据包括:
- 表的名字
- 表的列和分区及其属性
- 表的属性(是否为外部表)
- 表的数据所在的目录等
HQL语句在hive中进行查询
HQL的执行过程
- 解释器
- 编译器
- 优化器
共同完成对HQL语句从词法分析、语法分析、编译、优化以及**查询计划(Plan)**的生成
生成的Paln存储在HDFS中,并随后有MapReduce进行调用
Hive的体系结构
Hive的安装模式
嵌入模式
- 元数据存储在derby中
- 只允许一个链接
- 多用于Demo
本地模式
- 元数据通常存储在musql
- mysql数据与Hive运行在同一台物理机器中
- 多用与开发与测试
远程模式
- Hive与Mysql运行在不同的物理机器上