为什么使用虚拟机(VM)来运行和部署Hadoop集群及其模块?
问题描述:
我是Hadoop的新手,不知道为什么使用虚拟机(VM)来运行和部署Hadoop集群及其模块? 我们能不能通过本地的Linux/Unix系统为什么使用虚拟机(VM)来运行和部署Hadoop集群及其模块?
答
为什么虚拟机(VM)来运行和部署Hadoop集群及其模块的原因使用Hadoop的
由于大量的数据中心拥有比物理空间更多的虚拟空间。数以千计的服务器可以在几百台机器上运行(大约)。这就是云中的任何Hadoop集群 - 一大堆虚拟化机器。
由于一些企业只是想概念的小型,廉价的证明,哈登将他们现有的软件生态系统内工作。
因为这是一个简单的演示来启动虚拟机,而不是随身携带几台机器。
等等
不管怎么说,我会说这是强烈建议使用物理硬件,但成本Hadoop和补丁之间的时间和资源用金钱来维持和处理硬件故障和软件保持操作系统。主要你希望能够选择适合你的用例的硬件。大量存储“数据湖”或大量内存以进行快速处理。混合在一些SSD快速缓存...
当然,虚拟机让你动态地分配一些这些项目,但是当一个磁盘或记忆棒去腐败,它会影响所有虚拟机一台计算机上,而不是一个服务器
请链接到您指的部署说明。 – Thilo
它实际上强烈建议使用物理硬件Hadoop的......你的问题似乎更加为什么不是具体的约Hadoop的 –
@Thilo任何虚拟化:有npdeployment指令。我观看了一些教程,每个人都在使用Sandbox或Cloudera,所以我想知道为什么我们一定需要使用虚拟机。 – funnyguy