基于Hadoop的数据仓库Hive---大数据原理与技术--学习笔记七
数据仓库用于支持管理决策
(主要区别于一般数据库:比较稳定 、存历史数据)
有各自的服务战场
实时交互性读写,这时候需要借助HBase
HBase与Hive构成互补
Hive不支持更新、只支持批处理、执行延迟高
Mahout支持很多机器学习方法
用户接口模块
驱动模块
元数据存储模块、
针对HIve延迟高的问题,出现了Impala
statestore跟踪impalad的情况
最关心的是:
‘
数据仓库用于支持管理决策
(主要区别于一般数据库:比较稳定 、存历史数据)
有各自的服务战场
实时交互性读写,这时候需要借助HBase
HBase与Hive构成互补
Hive不支持更新、只支持批处理、执行延迟高
Mahout支持很多机器学习方法
用户接口模块
驱动模块
元数据存储模块、
针对HIve延迟高的问题,出现了Impala
statestore跟踪impalad的情况
最关心的是:
‘