如何在HBase中存储XML文件?

问题描述:

我试图在下列情况下工作:如何在HBase中存储XML文件?

  1. 我有简单的XML数据:

    <main_tag> 
        <x> 
         <a>name value</a> 
         <b>age value</b> 
        </x> 
        <y> 
         <c>country value</c> 
        <y> 
    </main_tag> 
    

    我想上面的XML文件存储在HBase的。我们该怎么做?

  2. 如果我有大量的XML文件,我该如何将文件批量加载到HBase中?

在这两种情况下,我最初都不想使用HDFS。

+2

http://stackoverflow.com/questions/8173983/best-way-to-store-hierarchical-data-in-hbase –

你的第一个问题由@ravindra回答。对于第二个问题,您可以选择批量加载,您可以使用map reduce读取大量数据,并将其转换为HFile格式,然后使用批量加载命令将map reduce的输出加载到Hbase。为此,由于map reduce会从HDFS读取数据,因此HDFS中应该有大量数据。

这也取决于你的数据。请查看here了解更多信息。

+0

所以,我们必须使用HDFS批量加载xml数据吗?你能否提供一个示例代码,将大量的xml数据加载到hbase中 –