【Hadoop】Error&Solution

  1. 问题描述: 启动hadoop集群start-all.sh,无报错。jps查看,master上只有DataNode没有NameNode
    解决方法: 查看NameNode日志($HADOOP_HOME/logs/hadoop-root-namenode-master.log),发现报错信息:
    【Hadoop】Error&Solution
    原因:namenode元数据被破坏,需要修复
    解决:恢复一下namenode
    hadoop namenode -recover
    一路选择c,一般就OK了

  2. 问题描述: 启动hdfs,jps查看无DataNode
    解决方法: 查看日志,发现报错:namenode和的Cluster ID不一致,All specified directories are failed to load.
    【Hadoop】Error&Solution
    原因是Hadoop启动后,在使用格式化namenode,会导致datanode和namenode的clusterID不一致
    这个ID的位置这么找:先找到/etc/hadoop/hdfs-site.xml
    里面有datanode的路径,在那个路径下找:/current/VERSION文件,即可修改clusterID
    注意:集群中的所有作为datanode的节点都要改