我们如何在Accumulo中创建二级索引?

问题描述:

我读Accumulo文档。我遇到了二级索引。我们需要创建这些独立的表还是内部创建的这些表?我们如何在Accumulo中创建二级索引?

辅助索引不会自动Accumulo创建。

它们纯粹是一个概念,你作为一个Accumulo用户,可以自由地实现,这取决于你的应用需求。

+0

建议编辑此答案:解释该概念通常由用户作为具有不同模式的单独表(换句话说,以与用户的其他表格不同的方式排列)实现。 – Christopher

有一对夫妇在这里常用的选项(也不是理想的):

  1. 创建整个表的第二个副本,但收录在次级柱(一个或多个)
  2. 创建第二个表是一个简单的键/值查找,其中关键字为次级柱(一个或多个)并将该值的 值是 相应行的主表中的ROWID

我期望第二选项是更可口的很快给n表示,引述Accumulo/Hive Integration documentation

与蜂巢3开始,索引已经被添加到Accumulo支持蜂巢 表。索引工作原理是利用另一个Accumulo表来存储 字段值映射到数据表的ROWID。索引表是 通过Hive插入记录时自动填充。