存储和搜索4百多万个文档

问题描述:

我期望为大型数据集实现存储和搜索解决方案,该解决方案拥有超过400万个文档。每个文档将有40个或更多的字段(或搜索标准)存储和搜索4百多万个文档

我以前曾与Lucene和Solr合作,所以我倾向于将它们用于此问题(当然欢迎任何其他想法和解决方案)。但是错误的是存储效率和可扩展性。我一直在寻找Cassandra和MongoDB以及其他NoSQL解决方案,但无法确定哪种技术最适合这种需求。

我想问一下,如果有人曾经遇到过类似的问题,她/他用来解决这个问题的..

+0

建议的问题是题外话这里,而在一般 – 2012-08-03 02:54:10

+0

stackexchange网站这是一个悬而未决的问题,没有具体的被要求什么。检查指南。 – DallaRosa 2012-08-03 03:10:18

+0

谢谢你帮助埃德蒙 – stephanruhl 2012-08-03 07:58:07