存储和搜索4百多万个文档
我期望为大型数据集实现存储和搜索解决方案,该解决方案拥有超过400万个文档。每个文档将有40个或更多的字段(或搜索标准)存储和搜索4百多万个文档
我以前曾与Lucene和Solr合作,所以我倾向于将它们用于此问题(当然欢迎任何其他想法和解决方案)。但是错误的是存储效率和可扩展性。我一直在寻找Cassandra和MongoDB以及其他NoSQL解决方案,但无法确定哪种技术最适合这种需求。
我想问一下,如果有人曾经遇到过类似的问题,她/他用来解决这个问题的..
检查一般参考这个调查论文:
文件的调查面向数据存储,一些可用的
http://cattell.net/datastores/Datastores.pdf
对于IEEE的用户指标:
NoSQL的评价:用例面向调查
http://www.computer.org/portal/web/csdl/doi/10.1109/CSC.2011.6138544
http://ieeexplore.ieee.org/xpl/login.jsp?tp=&arnumber=6138544&url=http%3A%2F%2Fieeexplore.ieee.org%2Fxpls%2Fabs_all.jsp%3Farnumber%3D6138544
谢谢你帮助埃德蒙 – stephanruhl 2012-08-03 07:58:07
建议的问题是题外话这里,而在一般 – 2012-08-03 02:54:10
stackexchange网站这是一个悬而未决的问题,没有具体的被要求什么。检查指南。 – DallaRosa 2012-08-03 03:10:18