是否有任何二进制索引文件访问技术?

问题描述:

假设我有一个非常大的字典/关联数组,我希望能够通过键快速查找值,并且使用最少的内存 - 因此将所有内容存储在内存中将不起作用。是否有任何二进制索引文件访问技术?

如果我要创建一个具有两列的完整MySQL数据库,我可以查询数据库并快速得到答案,即使服务器进程没有占用千兆字节的内存空间,也不会在多千兆字节磁盘读取。据推测有一些神奇的索引正在对二进制文件进行。很显然,MySQL是过度杀伤性的。

是否有一些明显的成熟技术可以填补我缺失的空白?最好使用在后台运行的专用服务器进程?我对从零开始编写数据结构不感兴趣。

那么,你可以尝试基于Lucene的Solr。

另一个有趣的选择可能是键/值数据库,例如Berkeley DB,这也很不错。

+0

谢谢,这些关键字正是我需要闯入维基百科的子图与我正在寻找 –

这看起来像你在寻找类似dbm。一个简单的键值存储。 Kyoto Cabinet是一个dbm实现。 Kyoto Tycoon是服务器部分。