存储和搜索4百多万个文档

问题描述：

我期望为大型数据集实现存储和搜索解决方案，该解决方案拥有超过400万个文档。每个文档将有40个或更多的字段（或搜索标准）存储和搜索4百多万个文档

我以前曾与Lucene和Solr合作，所以我倾向于将它们用于此问题（当然欢迎任何其他想法和解决方案）。但是错误的是存储效率和可扩展性。我一直在寻找Cassandra和MongoDB以及其他NoSQL解决方案，但无法确定哪种技术最适合这种需求。

我想问一下，如果有人曾经遇到过类似的问题，她/他用来解决这个问题的..

建议的问题是题外话这里，而在一般 – 2012-08-03 02:54:10

stackexchange网站这是一个悬而未决的问题，没有具体的被要求什么。检查指南。 – DallaRosa 2012-08-03 03:10:18

答

检查一般参考这个调查论文：

文件的调查面向数据存储，一些可用的
http://cattell.net/datastores/Datastores.pdf

对于IEEE的用户指标：

谢谢你帮助埃德蒙 – stephanruhl 2012-08-03 07:58:07