如何在HBase中存储XML文件?
问题描述:
我试图在下列情况下工作:如何在HBase中存储XML文件?
-
我有简单的XML数据:
<main_tag> <x> <a>name value</a> <b>age value</b> </x> <y> <c>country value</c> <y> </main_tag>
我想上面的XML文件存储在HBase的。我们该怎么做?
如果我有大量的XML文件,我该如何将文件批量加载到HBase中?
在这两种情况下,我最初都不想使用HDFS。
答
你的第一个问题由@ravindra回答。对于第二个问题,您可以选择批量加载,您可以使用map reduce读取大量数据,并将其转换为HFile格式,然后使用批量加载命令将map reduce的输出加载到Hbase。为此,由于map reduce会从HDFS读取数据,因此HDFS中应该有大量数据。
这也取决于你的数据。请查看here了解更多信息。
+0
所以,我们必须使用HDFS批量加载xml数据吗?你能否提供一个示例代码,将大量的xml数据加载到hbase中 –
http://stackoverflow.com/questions/8173983/best-way-to-store-hierarchical-data-in-hbase –