Hive数据仓库的搭建(内赋资源)

环境

        Leo采用的环境为:

        Ubuntu-Kylin-16.04

        jdk1.8.0_151

        Hadoop-2.9.0

        Hive安装版本:2.1.0

 

【Hive下载地址在文末】

一、解压缩文件

前提,Leo的VBox安装了增强功能,挂载Windows系统中的Install文件夹

也可以通过FileZilla进行ping通IP后导入压缩文件

 

1.mount挂载文件夹 /pcshare

Hive数据仓库的搭建(内赋资源)

 

2.查看权限

Hive数据仓库的搭建(内赋资源)

 

3.解压到 /usr/local文件夹下  利用tab键自动补全

 Hive数据仓库的搭建(内赋资源)

4.mv [a] [b]重命名 b是新名字(b名字在文件夹里不存在)

 Hive数据仓库的搭建(内赋资源)

5.修改文件权限使hadoop这个用户能使用

Hive数据仓库的搭建(内赋资源)

 

 

二、配置环境变量

 

 

1.vim编辑器,编辑/.bashrc文件

Hive数据仓库的搭建(内赋资源)

文件最下方添加HIVE的HOME和PATH

Hive数据仓库的搭建(内赋资源)

 

2.修改hive-site.xml.template文件,重命名为hive-default.xml

Hive数据仓库的搭建(内赋资源)

新生成一个hive-site.xml进行编辑

 

利用Tab键空行排版,一定一定要细心检查几遍

把<!—>注释框框删掉

Hive数据仓库的搭建(内赋资源)

Hive数据仓库的搭建(内赋资源)

 

 

三、配置mysql(之前已经安装完成)

 

1.      解压connector文件

Hive数据仓库的搭建(内赋资源)

 

2.      向hive导入jar包(Tab键自动补全)

Hive数据仓库的搭建(内赋资源)

3.      启动服务,登陆Shell界面

Hive数据仓库的搭建(内赋资源)

4.      新建hive数据库

Hive数据仓库的搭建(内赋资源)

5.      配置MySql允许hive接入

Hive数据仓库的搭建(内赋资源)

6.      启动hive,先启动Hadoop伪分布式集群

几个守护全部开启(jps)

Start-all.sh

Hive数据仓库的搭建(内赋资源)

Hive数据仓库的搭建(内赋资源)

开启hive

Hive数据仓库的搭建(内赋资源)

某种错误出现——黄线部分

Hive数据仓库的搭建(内赋资源)

配置单元Metastore数据库未初始化

为Hive建立相应的MySQL账户,并赋予足够的权限,执行命令如下

Hive数据仓库的搭建(内赋资源)

 

允许hive接入

Hive数据仓库的搭建(内赋资源)

同样地,刷新权限表

Hive数据仓库的搭建(内赋资源)

以hive用户登陆mysql,密码是hive

Hive数据仓库的搭建(内赋资源)

这是由于没有初始化数据库,生成元数据。

需要执行以下指令(在hive的bin目录下执行)

./schematool -initSchema -dbType hive(hive是database 的名字)

Hive数据仓库的搭建(内赋资源)

反复摸索6次后,我的hive起来了

Hive数据仓库的搭建(内赋资源)

Hive数据仓库的搭建(内赋资源)

利用MySQL数据库保存Hive元数据

四、Hive的基本操作:

(1)      创建database

Hive数据仓库的搭建(内赋资源)

(2)      /usr/local下新建一个usr.txt(用以存储数据信息)

记得用sudo给Hadoop用户赋予root权限

Hive数据仓库的搭建(内赋资源)

Hive数据仓库的搭建(内赋资源)

Hive数据仓库的搭建(内赋资源)

(3)      导入database hive

Hive数据仓库的搭建(内赋资源)

(4)      Describe table

Hive数据仓库的搭建(内赋资源)

 

(5)      查询功能

Hive数据仓库的搭建(内赋资源)

(6)      Overwrite重写前一个table usr,创建拥有相同列的空表 new_usr

Hive数据仓库的搭建(内赋资源)

出现了神秘问题(提示我使用Hive 1.x.y的版本)

Hive-on-MR在Hive 2.x.y中不推荐使用,并且可能在未来的版本中不可用

可能是hadoop的block的冗余数量没设置正确,

也可能是版本不完全匹配的问题

Apache-Hadoop官方文档显示适配 Hive1.x.y 的版本

安装之前最好上Apache的官网上瞅瞅说明

PS:【http://www.apache.org/      网页上方的project里找到Hadoop或者Hive】

==========================================================

链接:https://pan.baidu.com/s/1KoN1-PRGNlLunZkEeXOOug

密码:z4la