最近我开始了解图形数据库,我读到这些数据库的分析能力有限。我在这里读到http://www.readwriteweb.com/enterprise/2009/02/is-the-relational-database-doomedp2.php“在这种类型的数据库平台上,跟踪使用模式和提供基于用户历史的建议可能在最好的情况下是困难的,在最坏的情况下是不可能的。”
1我不能理解为什么这种分析在这里是有限的?
2如何使用这些数据库图形进行归档,例如facebook,它保存了数百万用户的所有帖子。如何在图形数据库中做到这一点?
发布于 2011-03-28 03:05:36
如果你应用一个严格的属性图模型,你会发现你有很好的“数据本地”操作,比如探索一个节点周围的数据,比如说,沿着关系有5个跳跃。但是,像“给我名称属性值为‘Tom*’的所有节点”这样的全局操作需要在图模型中对数据进行全面扫描。从理论上讲,这是一个限制。在实践中(就像在http://neo4j.org中),图引擎与诸如Lucene、BerkelyDB或Cassandra之类的全局决策相结合,这些全局决策可以处理这种数据-在某些分析场景中经常使用的全局方面。
因此,没有真正的限制,只是以不同的方式和不同的模式来处理数据的全局和本地操作。有关在图中建模域的一些示例,甚至可以查看http://wiki.neo4j.org/content/Domain_Modeling_Gallery示例,如Open Street Map图上的https://github.com/neo4j/neo4j-spatial/raw/master/src/site/pics/one-street.png。
对于像Facebook这样的海量数据归档,我只会将最近一个月左右的状态更新存储在图表中,以便快速检索和推荐。其余的我会归档在像Cassandra这样的解决方案中,并且在图中只有一个关于如何检索这个“归档子图”的参考和关键指标。
https://stackoverflow.com/questions/5450154
复制相似问题