hadoop安装教程

第一步 给自己创建的用户root权限

1.以管理员身份登录虚拟机,右键—>在终端中打开,打开后界面如下:hadoop安装教程
2 输入命令:vim /etc/sudoers,回车后会打开sudoers这个文件,找到第98行:root ALL=(ALL) ALLhadoop安装教程
3.将光标移动到98行前,如图位置,键盘直接敲yyp,复制该行内容至下一行,键盘敲i进入插入模式,将root改为你的用户名,键盘敲Esc退出插入模式,输入:wq,回车,保存退出。hadoop安装教程

第二步 配置基础网络

1. 配置网络连通

在终端中打开,输入命令行如下
hadoop安装教程
打开文件后,将以下配置进行更改
BOOTPROTO=static
ONBOOT=yes
添加以下配置
IPADDR=192.168.218.10
NETMASK=255.255.255.0
GATEWAY=192.168.218.2
DNS1=8.8.8.8
hadoop安装教程
保存后退出,然后重启网络:
service network restarthadoop安装教程

2. 配置网络地址与主机名的对应关系(可选可不选)

在终端中打开 ,输入命令:sudo vim /etc/hostname
打开文件后将此文件内容全部删除,更改为你的当前操作主机的主机名,保存退出
sudo vim /etc/hosts
在最后新建一行,添加以下内容
IP地址1 主机名1
IP地址2 主机名2
IP地址3 主机名3
hadoop安装教程

3. 关闭防火墙

终端命令,关闭防火墙
systemctl strop firewalld.service
设置防火墙开机不自动启动
Systemctl disable firewalld.service
hadoop安装教程

第三步 设置免密登录

首先生成公私钥
ssh-****** -t rsa
打开用户目录下的.ssh目录
cd
cd .ssh
将公钥文件拷贝成authorized_keys
cp id_rsa.pub authorized_keys
验证
ssh 本节点主机名,若无需输入密码可直接登录则设置成功

第四步 jdk安装

复制jdk文件(.tar.gz格式)到用户目录下
在此目录下新建java目录,将安装包移动到该目录下解压
tar zxvf 压缩包名hadoop安装教程
解压后为了方便后期操作,将解压后目录名重命名为jdk
hadoop安装教程
打开并编辑用户目录下的.\bashrc文件
vim ~/.bashrc
在正文的后面添加以下内容
Export JAVA_HOME=/home/ryan/java/jdk
Export PATH=PATH:PATH:JAVA_HOME/bin
保存退出hadoop安装教程
让该文件立即生效
source ~/.bashrc
卸载已有jdk(可选)
查询已安装包名中包含jdk的
rpm -qa |grep jdk
卸载方法
rpm -e 包名 --nodeps(忽略依赖关系)

使用java -version命令验证
如果显示版本号与安装版本号相同,则证明安装成功了hadoop安装教程

第五步 hadoop安装

首先将hadoop安装包复制到用户目录下,新建hadoop目录。将安装包移动到该目录下解压。将解压完成后的目录(hadoop-2.6.2)改名为hadoop(为了方便)具体做法参考jdk安装

将hadoop根目录下的bin目录和sbin目录路径加入到PATH中,更改~/.bashrc文件如下(lxh改为你的主机名)
hadoop安装教程
改完后,执行source命令令其立即生效
source ~/.bashrc
使用hadoop version验证是否成功
hadoop安装教程

第六步 文件配置

hadoop安装教程
在$HADOOP_HOME/etc/hadoop/目录下
需要配置以下文件
hadoop-env.sh
export JAVA_HOME=/home/主机名/java/jdk
hadoop安装教程

yarn-env.sh
export JAVA_HOME=/home/主机名/java/jdk
hadoop安装教程
core-site.xml
在configuration标签中添加以下变量和值

<property>
<name>fs.defaultFS</name>
<value>hdfs://node-1:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/home/ryan/hadoop/hadoop/tmp</value>
</property>

hadoop安装教程

hdfs-site.xml

<property>(如果不设置该参数,则默认值为3)
<name>dfs.replication</name>
<value> 2</value>
</property>
<property>(如果不设置该参数,则默认值为$hadoop.tmp.dir/dfs/name)
<name>dfs.namenode.name.dir</name>
<value>/home/主机名/hadoop/hadoop/tmp/dfs/name </value>
</property>
<property>(如果不设置该参数,则默认值为$hadoop.tmp.dir/dfs/data)
<name>dfs.datanode.data.dir</name>
<value> /home/主机名/hadoop/hadoop/tmp/dfs/data </value>
</property>

hadoop安装教程

mapred-site.xml
(该文件需经mapred-site.xml.template重命名转变来:mv mapred-site.xml.template mapred-site.xml)

<property>
<name>mapreduce.framework.name</name>
<value>主机名</value>
</property>

hadoop安装教程
yarn-site.xml

主机名.resourcemanager.address
rmhostname:8032

hadoop安装教程

slaves
在此文件中写明所有从节点的节点名,一行一个(如果为伪分布式部署,则默认localhost即可,无需更改)hadoop安装教程