windows下的hadoop安装
这是我在windows下安装hadoop的过程,综合了很多文章的方法。
1.下载hadoop
下载地址:http://download.****.net/detail/kokjuis/9706480
2.安装过程
1)解压下载好的 hadoop-2.8.0.tar.gz 到某个盘***意路径里不要带空格,否则可能会无法正确识别。
2)配置hadoop环境变量(跟配置JAVA环境变量类似)。 创建HADOOP_HOME,另外在Path下添加 %HADOOP_HOME%\bin
3)到hadoop根目录,如果没有data文件夹的话就新建一个,然后在data下分别创建datanode、namenode两个文件夹
4)打开 \hadoop-2.8.0\etc\hadoop\hadoop-env.cmd文件,修改JAVA_HOME为jdk路径。如果你的JDK安装在Program Files目录下,名称用\PROGRA~1\Java 否则中间的空格可能会识别失败。
5)下载缺少的hadoop.dll以及winutils.exe
下载这两个文件,放在hadoop下的bin目录下,并在环境变量Path和HADOOP_HOME下配置hadoop下的bin。
我的下载地址是:
https://github.com/steveloughran/winutils/ 【注意版本号】
6)上述配置后,可能需要重启。接下来,修改hadoop/etc/hadoop/core-site.xml及hdfs-site.xml文件
core-site.xml
这个地址是之后访问HDFS的url。
hdfs-site.xml
如果没有添加permission,可能在之后连接hdfs的时候被连接拒绝。添加dfs.name.dir 和 dfs.data.dir是因为刚开始我format了太多次datanode,导致datanode一启动就挂掉了,是因为namenode的值一开始就确定了,但是对datanode进行太多次format,两者不一致,所以datanode就启动不起来,设置这两个值之后就可以了。这两个地址就是之前添加的data文件夹下的。
7)切换到etc/hadoop目录,运行hadoop-env.cmd
格式化HDFS文件系统,切换到bin目录然后执行命令:hdfs namenode -format(鉴于上述问题,这个命令还是只执行一次比较好。。)
执行hadoop version,看看hadoop是否安装成功。
3.启动及使用
进入到hadoop下的sbin目录,点击start-all.cmd,然后都启动正常就可以使用了。(JPS命令可以查看节点是否都启动了)
打开命令行,执行hdfs dfs -ls hdfs://localhost:9000/ 就可以看到这个文件系统了,然后在这里可以执行mkdir命令建新的文件夹等等。(这个localhost不一定是哪个IP地址,要看自己的HOSTS将它映射到哪个IP)
结束。。。