我正在从事的项目目前使用Neo4j社区。目前,我们处理1-5米的顶点有5-20M的边,但我们的目标是处理10-20M的顶点w/ 50-100 m的边。我们正在讨论切换到图形数据库开放源码项目的想法,该项目将使我们能够按此比例进行扩展。目前,我们的注意力集中在卡桑德拉的詹图格上。
我们有一些关于Janusgraph的能力和发展的问题,我们很高兴有人能回答!(也许是米莎·布鲁克曼还是亚伦·普洛伊茨?)
简图功能:
g.V().has("secText", "some text").inE().outV();
此外,当我尝试插入更多的记录(扩展到100 k的顶点)时,停靠者图像似乎崩溃了。
我们想知道这是否是由于码头形象的有限性质,或是否有任何问题,或是否可能是正常的?不管怎样,看起来真的,真的很慢。--
从我在互联网上看到的
关于詹斯图的未来:
在最初几年(比如2016-2018年),
谢谢你阅读这篇文章,我期待着你能给我的所有答案:)祝你今天愉快!
麦尔
发布于 2020-08-25 03:42:47
卡桑德拉的JanusGraph在存储层有设计限制,这使得性能变慢。实际上,它是一个大的、可扩展的、但速度慢的图形数据库,它提供了Cassandra的复制和冗余优势。
Cassandra分解数据,并且非常擅长在集群中随机分配数据,但是这会破坏数据的局部性,这是使遍历更快、更高效所必需的。除了Cassandra,JanusGraph还支持多个后端存储选项,这意味着它没有对任何特定的存储体系结构进行严格的调整。
内存可能会产生影响,因此验证您在每个节点上为JVM分配了多少内存,使用G1GC并禁用交换。VisualVM有助于分析您的内存空间。
发布于 2021-05-25 01:24:42
你好,我知道可能要晚了但是请告诉我。您是否访问所有用于分析或事务查询的顶点?OLAP还是OLTP?因为你要查询多少个顶点和边,以及你是如何做到这一点的,所以有很大的影响。例如,您是否告诉Janusgraph返回一个顶点,该顶点有数以百万计的边,所有这些边都在一次拍摄中,或者只有少数几个边。这被称为热点顶点(一个顶点具有许多不能存储在一个服务器实例上的边缘)。
https://stackoverflow.com/questions/63567936
复制相似问题