虽然我不使用Neo4j,而是使用TitanDB (IBMGraph),但由于我对图形数据库还不熟悉,目前我已经使用Neo4j文档中建议的模式来建模一个基本的新闻提要。
http://neo4j.com/docs/snapshot/cypher-cookbook-newsfeed.html
在全面阅读了所有文档之后,我意识到这些数据库运行方式之间的几个关键差别。
在链接中描述的模型中,每个用户posts都存储为由edges彼此连接的vertexes,形成了从每个user顶点发出的状态更新的长列表。
虽然考虑到Neo4j的能力,这是有意义的,但我知道TitanDB具有vertex-centric索引功能,在这里详细描述如下:
http://s3.thinkaurelius.com/docs/titan/1.0.0/indexes.html
现在,我正在努力确保查询给定用户提要是最优的,对于一个拥有大量用户的大图,以及大量永久保存的帖子或状态更新。因此,我想避免遍历所有的帖子,所有的用户朋友,然后最后订购和限制他们,只是为了得到一个用户饲料的前15项。
因此,我不确定Neo4j文档中描述的模型是否真的是与TitanDB一起使用的最佳模型,因此我的问题如下:
post顶点直接连接到发布它的user,并在每个posted边缘的time属性上使用vertex-centric索引?我真的是在寻求一些关于在土卫六数据库中建模、索引和检索基本新闻提要的一般性建议。提前谢谢。
发布于 2016-10-18 18:19:32
基本模式看起来并不是一种糟糕的方法,尽管很难根据这个用例做出一个好的判断。
解决索引问题的最简单方法可能是对一个位进行去denormalize -将用户id存储为post顶点上的一个属性,并在[user, timestamp]对上创建和索引。
以顶点为中心的索引可能对您有所帮助,但在建议的模型中则不然--您需要将post建模为边缘,将节点建模为顶点,这可能会使其他遍历变得非常尴尬。此外,在当前发布版本时,IBMGraph并不支持以顶点为中心的索引。
https://stackoverflow.com/questions/40114104
复制相似问题