如何与边缘节点上运行的Hadoop集群时连接到帕拉

问题描述:

我已经使用了Cloudera Manager安装的Hadoop集群,目前羚羊守护进程是所有的数据节点上运行。群集位于网关/边缘节点之后,只有网关服务安装在边缘节点(例如httpfs,蜂巢网关,火花网关,oozie)上。如何与边缘节点上运行的Hadoop集群时连接到帕拉

我在想,如何从使用Gateway/Edge节点连接Impala,因为所有Impala守护进程都在Cluster的Data节点上运行,并且没有服务暴露给Gateway/Edge节点。

+0

您可以在边缘节点https://www.cloudera.com/documentation/enterprise/5-8-x/上安装斑羚CLI主题/ impala_install.html –

+0

问题不在于Impala CLI,我已经在边缘节点上安装了Impala CLI。问题是我的hadoop集群位于边缘节点的后面,因此要在我的hadoop集群上执行任何操作,我必须连接到运行在数据节点上的一个impala守护进程,这将无法从外部连接。我将尝试facha建议的HA方法。 –

+0

呃......请注意,在“HAProxy的”,重要的部分是** **代理,而不是HA ......因为那代理将成为*,事实上*,一个SPOF。高可用性非常重要。 –