centos6.5下Hadoop集群环境配置

一：配置主节点Master

1：下载并解压安装包

首先将压缩包移至mark用户的主目录下，然后执行下述命令对其进行解压

mv hadoop-2.5.2.tar.gz /home/mark

tar -xvf hadoop-2.5.2.tar.gz

cd hadoop-2.5.2

解压后在当前目录下生成hadoop-2.5.2文件夹

centos6.5下Hadoop集群环境配置

2：配置hadoop-env.sh

打开hadoop-env.sh,配置JDK路径

vim /home/mark/hadoop-2.5.2/etc/hadoop/hadoop-env.sh

将 export JAVA_HOME=${JAVA_HOME}

修改为 export JAVA_HOME=/usr/java/jdk1.7.0_71/ （根据实际Java安装路径进行设置）

centos6.5下Hadoop集群环境配置

3：配置yarn-env.sh

打开yarn-env.sh，配置JDK的路径

vim etc/hadoop/yarn-env.sh

将 export JAVA_HOME=/home/y/libexec/jdk1.6.0/

修改为 export JAVA_HOME=/usr/java/jdk1.7.0_71/

centos6.5下Hadoop集群环境配置

4：创建数据目录hadoopdata

分别在master、slave1、slave2上切换至mark用户，然后在主目录下创建数据目录hadoopdata

mkdir /home/mark/hadoopdata

5：配置core-site.xml （以下配置都是在cd hadoop-2.5.2前提下完成）

打开core-site.xml文件

vim etc/hadoop/core-site.xml

用以下代码覆盖core-site.xml文件中的内容

<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://master:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/home/mark/hadoopdata</value>
</property>
</configuration>

6：配置hdfs-site.xml

打开hdfs-site.xml文件

vim etc/hadoop/hdfs-site.xml

用下面代码替换hdfs-site.xml文件中的内容

<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>

</configuration>

7：配置yarn-site.xml

打开yarn-site.xml文件

vim etc/hadoop/yarn-site.xml

用下面代码替换yarn-site.xml文件中的内容

<configuration>


<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.resourcemanager.address</name>
<value>master:18040</value>
</property>
<property>
<name>yarn.resourcemanager.scheduler.address</name>
<value>master:18030</value>
</property>
<property>
<name>yarn.resourcemanager.resource-tracker.address</name>
<value>master:18025</value>
</property>
<property>
<name>yarn.resourcemanager.admin.address</name>
<value>master:18141</value>
</property>
<property>
<name>yarn.resourcemanager.webapp.address</name>
<value>master:18088</value>
</property>
</configuration>

8：配置mapred-site.xml

复制/home/mark/hadoop-2.5.2/etc/hadoop目录下的mapred-site.xml.template文件，另存为该目录下的mapred-site.xml

cp etc/hadoop/mapred-site.xml.template etc/hadoop/mapred-site.xml

打开mapred-site.xml

vim etc/hadoop/mapred-site.xml

用下面的代码覆盖mapred-site.xml中的内容

<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>

9：配置slaves文件

打开slaves文件

vim etc/hadoop/slaves

用下面代码替换slaves中的内容(此处既可给出两个节点的IP地址，也可给出机器名，但要求各自独占一行)

slave1

slave2

二：配置从节点

将master节点的mark用户主目录下的hadoop-2.5.2文件夹分别复制至每个节点的mark用户目录下

scp -r hadoop-2.5.2 slave1:~/

scp -r hadoop-2.5.2 slave2:~/

三：配置系统文件

分别在master、slave1、slave2上以mark用户执行以下步骤

1：配置系统文件

vim ~/.bash_profile

2：配置以下环境变量

export HADOOP_HOME=/home/mark/hadoop-2.5.2

export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

3：使配置生效

source .bash_profile

四：启动Hadoop集群

1：格式化文件系统

在master节点上执行下面的格式化命令

hdfs namenode -format

2：启动Hadoop

cd ~/hadoop-2.5.2

sbin/start-all.sh

3：验证

master的终端窗口执行jps命令后会出现4个进程，slave1、slave2会有3个进程

centos6.5下Hadoop集群环境配置

同时也可以通过Web UI查看集群是否成功启动，在master上启动Firefox浏览器，在浏览器输入http://master:50070/，检查NameNode和DataNode是否正常启动

centos6.5下Hadoop集群环境配置

在master启动Firefox浏览器，在地址栏输入http://master:18088/,检查Yarn是否正常启动

centos6.5下Hadoop集群环境配置

centos6.5下Hadoop集群环境配置

相关推荐