我有一个节点类型,它有一个字符串属性,它经常具有相同的值。等。该字符串值只有5个选项的数百万个节点。我会根据那处房产进行搜索。
我的问题是在性能和内存方面哪个更好: a)将其实现为节点属性,并具有大量重复项(并使用WHERE进行搜索)。b)将其实现为5个附加节点,其中所有原始节点都引用其中一个节点(并使用附加匹配进行搜索)。
发布于 2013-03-18 17:12:09
在不了解更多细节的情况下,很难给出通用的答案。
从性能的角度来看,最好是尽可能早地限制搜索。如果您不必查看遍历的属性,则会更有好处。
鉴于此,我假设最好将查找属性移动到一个单独的节点中,并使用该值作为关系类型。
发布于 2014-01-30 19:38:24
使用labels;这篇博客文章很好地介绍了这个新的Neo4j 2.0特性:
发布于 2013-03-18 19:41:00
我也考虑过这个问题。在我的例子中,我必须表示状态:
总体而言,Node + Relationship方法看起来更有吸引力,因为每次只需要维护一个关系引用,而不是属性字符串,而且您不需要扫描必须在属性上维护的额外索引(内存和性能直观上有利于此方法)。
另一个优点是它很容易支持将一个节点链接到多个“特殊节点”的能力。如果您预见到在您的模型中这应该是可能的情况,这比必须使用属性数组(并使用“in”进行搜索)要好。
在实践中,我发现问题变成了,每次如何访问这些特殊的节点。要么你维护某种常量引用,你有这些特殊节点的节点ID,你可以在你的START语句中直接跳到它们里面(这就是我们所做的),或者你每次都需要搜索特殊节点的属性(可能是名称),然后遍历它的关系。这并不是最漂亮的cypher查询。
https://stackoverflow.com/questions/15472990
复制相似问题