我正在尝试使用Monte Carlo Sampling实现incremental PageRank。我的数据包括20个不同实体之间的数百万关系数据。
我发现Amazon DynamoDB和FlockDB是我作为数据存储任务的两个很好的候选者。简单比较一下here。谁能指出哪一个更适合我的PageRank任务?
发布于 2013-01-23 04:28:24
这个答案应该和健康剂量的盐一起服用,因为我不是100%同意你的要求。
首先,也是最明显的,这篇论文来自Twitter (个性化页面ran - SALSA)。我知道在某种程度上,他们的推荐/个性化负责人说,他们使用了一系列其他技术(这是从10月11日) https://fbcdn-sphotos-b-a.akamaihd.net/hphotos-ak-snc7/300267_581958426587_2140504611_n.jpg
至于哪一个更适合你的任务,我会选择FlockDB。主要原因是它支持基于图的查询,这在你的代码中将是相当常见的。它还具有一些显式的持久化图功能,例如持久化边缘信息。
https://stackoverflow.com/questions/14134354
复制相似问题