我需要一些帮助来决定我们应该为我们的项目选择哪个数据库。我们正在开发一个web应用程序来收集关于用户行为的数据并对其进行分析(糟糕的解释,但我不能提供更多的细节;web分析数据是我们的核心数据集之一)。我们估计每周将有大约2亿行插入到数据库+根据原始数据计算的数据中。数据必须保留至少六个月。
我上周花了一半时间收集关于不同解决方案的信息,但似乎有太多的信息让我感到迷茫。我发现的最有希望的是卡桑德拉,Hbase和蜂巢。我还查看了MongoDb、Redis和其他一些东西,但它们看起来好像适合不同的需求,或者社区没有那么活跃。
,
我还考虑过使用MySql (因为我们无论如何都会将其用于所有用户信息等等),但在将来,缩放将变得更加困难,而且我认为,无论如何,我们都必须迁移到其他数据库。我们也非常愿意投入一些时间和精力来推动选定的数据库的发展。
发布于 2010-07-07 14:29:32
我们决定继续使用Hadoop(& Hive/Hbase)作为我们的主要数据存储。造成这种情况的主要原因是:
它已经被证明是一种技术,许多大型站点都在使用它-- (Facebook...).
https://stackoverflow.com/questions/3179465
复制相似问题