首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >用于存储数百万条tweet的数据模型

用于存储数百万条tweet的数据模型
EN

Stack Overflow用户
提问于 2014-04-25 15:08:56
回答 1查看 114关注 0票数 1

由于与分析相关的原因,我目前存储了大约2亿条推特。它大约需要300 G的MySQL db。在未来,它仍将继续增长。我对这些数据执行了很多搜索查询和分析性查询。到目前为止,MySQL正在按预期执行。在未来,我希望水平缩放和保留现有的全文查询能力和分析性查询能力。我应该考虑哪些选项(都是关系/NoSQL)?我目前使用solr进行全文搜索。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-04-25 17:01:41

最终(很快),您将拥有过多的数据,无法有效地处理单个服务器。

Cloudera将Hadoop与Solr集成在一起,将全文搜索与HDFS中的分布式数据服务器集群结合起来。通过这种方式,您可以通过添加更多的服务器来继续扩展。

http://www.cloudera.com/content/cloudera/en/products-and-services/cdh/search.html

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/23296802

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档