其想法是重新设计数据结构和/或更改DB。我刚刚开始回顾这个项目,并计划从这个项目开始优化。
目前,我有CouchDb和大约80 of 的文档数据,围绕30M记录。从大多数文档的子集(如id、group_id、location、类型)可以认为是泛型属性,但不幸的是,这些属性现在甚至存储在集合周围的不同属性命名中。此外,还可以找到许多深嵌套的。
结构不是很难定义的,这就是为什么在看到图片之前选择NoSQL db的原因。
数据是在功能强大的集群上的单独作业中在DB中计算和填充的。这不是经常做的事。从这个角度来看,我可以得出结论,一般的写/更新性能并不是很重要。同时,缩小规模也是很大的,但并不是最重要的。一次只有1到10个活跃的客户。实际上,阅读性能与各种过滤/分组等是最重要的。但是不应该进行大量的汇总计算,这一项已经在人口中完成了。
这是一个数据分析工具,用于向质量工程师和数据分析人员显示比较报告和其他报告,这样他们就可以从Web中浏览结果、分组或筛选。
现在,由于性能原因,搜索文本的文档属性子集这样的任务是不可能的。
当然,我已经做了一些初步的调查(比如EndPoint.pdf),看起来卡桑德拉在NoSql中似乎是个不错的选择。
而且,尝试将这些数据移植到新的PostgreSQl中也很有趣。
如有任何意见,将不胜感激:)
发布于 2015-06-09 06:58:15
您好,请查看下列文章:
http://www.enterprisedb.com/nosql-for-enterprise
对我来说,PostgreSQL json(和jsonb!)功能允许启动模式-少,有事务,索引,分组,聚合功能非常好的性能,只是从一开始。当准备就绪(如果需要的话),您可以选择模式,并进行内部数据迁移。
也请检查:https://www.compose.io/articles/is-postgresql-your-next-json-database/
祝好运
https://stackoverflow.com/questions/30720380
复制相似问题