Windows 64位系统上搭建Hadoop伪分布式环境
1.安装jdk,设置环境变量
2.下载hadoop2.7.7
http://mirror.bit.edu.cn/apache/hadoop/common/hadoop-2.7.7/hadoop-2.7.7.tar.gz
3.解压hadoop2.7.7到文件夹下(用好压软件解压)
4.下载hadooponwindows-master(已经上传至百度网盘)
使用hadooponwindows-master的bin和etc替换hadoop2.7.7的bin和etc文件夹
5.配置HADOOP_HOME
配置path
6.使用编辑器打开D:\hadoop-2.7.7\etc\hadoop\hadoop-env.cmd
修改JAVA_HOME的路径
把set JAVA_HOME改为jdk的位置
注意其中PROGRA~1代表Program Files
7.修改hadoop-2.7.7/etc/hadoop/hdfs-site.xml
在data所在的目录下新建data目录和tmp目录,在data文件夹下新建namenode和datanode文件夹
修改core-site.xml
8.还需要把hadoop.dll(从)拷贝到 C:\Windows\System32
以管理员身份打开命令提示符
9.转到Hadoop-2.7.7\sbin文件下,输入start-all (停止运行的所有节点的命令为 stop-all)
出现以下四个窗口说明启动成功
输入jps -
查看运行的节点
10.访问http://localhost:50070,访问hadoop的web界面
访问http://localhost:8088,访问yarn的web界面
下面可以测试Hadoop自带的Wordcount
1.在d盘新建一个txt文件t1.txt
2.把t1上传到HDFS: hadoop fs -put d:\t1.txt /tmp_test/t1.txt (注意t1文件夹需要使用命令新建 hadoop fs -mkdir /tmp_test)
3.cd进到mapreduce,然后可以开始运行wordcount了:
hadoop jar /D:\hadoop-2.7.7\share\hadoop\mapreduce\hadoop-mapreduce-examples-2.7.7.jar wordcount \tmp_test \output
4.查看结果