什么是我webHDFS在Azure HDInsight网址?

问题描述:

新来这里Azure上。我刚刚在一个普通的存储帐户上完成了一个新的HDInsight实例,并创建了一个新的存储实例。我想知道我的webHDFS网址是/我在哪里可以找回它以及我如何访问它。什么是我webHDFS在Azure HDInsight网址?

我不使用Azure的数据存储湖。 (几乎每一个环节,我发现蔚蓝相关导致了一些数据湖链接)

我HDFS-site.xml中:

<property> 
    <name>dfs.webhdfs.enabled</name> 
    <value>true</value> 
</property> 

核心的site.xml:

<property> 
    <name>fs.defaultFS</name> 
    <value>wasb://<my hdinsight storage name>@<my hdinsight name>.blob.core.windows.net</value> 
    <final>true</final> 
</property> 

你的基地webHDFS FileSystem的URI应该是:webhdfs://<HOST>:<HTTP_PORT>您的主机应CLUSTERNAME.azurehdinsight.net和HTTP_PORT应该默认为80。

相应的HTTP URL格式如下

http://<HOST>:<HTTP_PORT>/webhdfs/v1/

+0

又该端口是什么?我曾经尝试都50070个50075 – ProgrammingUnicorn

+0

更新了答案 – juvchan

+0

仍然没有骰子。无论如何检查它的运行?我使用错误的主机名? – ProgrammingUnicorn

Webhdfs端口是相同HDFS的NameNode端口,可以使用下面的属性来覆盖该端口 - dfs.namenode.http-address默认值是50070.

https://hadoop.apache.org/docs/r2.7.1/hadoop-project-dist/hadoop-hdfs/hdfs-default.xml

当您访问通过卷曲或浏览器webhdfs,你必须给端口号如下。

http://<HOST>:<HTTP_PORT>/webhdfs/v1/

http://<HOST>:50070/webhdfs/v1/