为什么Hadoop的丢失节点
我很困惑,当我运行commond“Hadoop的dfsadmin -report”我可以看到有为什么Hadoop的丢失节点
但资源管理器,聚集度量,它表明
这是为什么?为什么会发生这种情况? 在此先感谢!
您与9个从节点连接。但是5个从节点处于活动状态,其余的处于不健康状态。
原因不健康状态:
Hadoop的MapReduce的提供,通过该管理员可以配置向TaskTracker运行管理员周期性地提供的脚本,以确定是否一个节点是健康的或不的机构。管理员可以通过在脚本中对其选择进行任何检查来确定该节点是否处于健康状态中。如果脚本检测到节点处于不健康状态,则它必须以字符串ERROR打印一行到标准输出。 TaskTracker定期生成脚本并检查其输出。如果脚本的输出包含ERROR字符串(如上所述),则该节点的状态将报告为'不健康',并且该节点在JobTracker上被列入黑名单。没有更多的任务将被分配给这个节点。但是,TaskTracker将继续运行该脚本,以便如果该节点再次变得健康,它将自动从JobTracker上的黑名单节点中删除。管理员可以在JobTracker的Web界面中使用该节点的健康状况以及脚本的输出(如果不健康)。自节点健康以来的时间也显示在Web界面上。
原因丢失的节点:
我认为某些块(数据)可能不奴隶用。因此,它显示丢失的节点9
要从集群中删除节点死亡使用这个链接To Decommission Nodes
ResourceManager中的集群度量标准显示NodeManager的状态。
hadoop dfsadmin -report
此命令显示Datanodes的状态。
谢谢!但是,“活动节点”和“丢失节点”的关系是什么,因为我只有9个datanode,为什么说'活动节点是5','丢失节点是8',5 + 8 = 13> 9 – user2991640 2014-11-25 12:06:29
有帮助。谢谢+1 – Kumar 2014-11-25 12:36:52
谢谢@kaveen +1 – Kumar 2014-11-25 12:35:52
链接已死,请更新您的答案。谢谢 – ImbaBalboa 2017-06-28 08:26:54
解除节点的更新步骤,让我知道如果你有任何疑问,谢谢。 – 2017-06-28 10:40:11