凤凰视图为巨大的HBase表
问题描述:
我正在安装HBase 1.1.2和Phoenix 4.7 Hortonworks数据平台2.6群集。凤凰视图为巨大的HBase表
我有一个巨大的HBase表,有很多列,如果添加新数据(数据由HBase API的Put机制添加),有时会添加新列。
现在我想使用凤凰这个表。我发现本教程,我必须创建一个基于HBase表格结构的单独Phoenix视图:https://khodeprasad.wordpress.com/2016/07/26/how-to-use-existing-hbase-table-in-apache-phoenix/
基于本教程,我必须列出所有列族和列(!现在还在增加),那么这将是很多工作,如果将新列添加到HBase表中,视图将不会保持最新。
现在,这里我的问题是:
- 是否有意义使用凤凰城如此巨大的表,也可以随时间变化?
- 有没有一种方法可以创建类似于自动适合HBase列的“动态”Phoenix视图?
答
Phoenix可以很好地处理随着时间变化的巨大表格。如果稍后添加列,则可以更改只读视图并添加列。 phoenix视图将追溯显示来自该列的所有数据。没有办法创建一个动态视图,就像你可以在SQL中使用SQL(即CREATE VIEW查看AS SELECT * FROM TABLE)一样,无需编写自己的Java程序来创建并保持列的最新状态
您可能想要看看只读视图https://phoenix.apache.org/views.html。 Phoenix对海量数据集相当不错,但是......你应该用一个视图来分析你的数据模型。这是确定的唯一方法。如果它只是一张表,我认为它会比SELECT/JOIN执行得更好 –