我正在用训练GraphSage算法来提取图形嵌入。我正在处理一个由(82,339,589)个节点和(219,521,164)边组成的大图。当我使用“:query”命令检查时,查询被列为正在运行。算法从6天前开始。当我查看带有“”的日志时,最后列出的日志如下
2021-12-01 12:03:16.267+0000信息存储库扫描(RelationshipScanCursorBasedScanner):从16247 MiB (17,036,668,320字节)进口352,492,468条记录和0项属性;花费59.057 s,5,968,663.57关系/s,275 MiB/s (288,477,487字节/s)(每个线程: 1,492,165.89关系/s,68 MiB/s (72,119,371字节/s)) 2021-12-01 12:03:16.269+0000 INFO [新4j.BoltWorker-3] INFO [新4j.BoltWorker-3螺栓]加载加载图的实际内存使用情况: 8602 MiB INFO [新4j.BoltWorker-3螺栓] GraphSageTrain ::Start
有一种方法可以查看关于培训过程的详细日志。对于尺寸相同的图形,用6天是正常的吗?
发布于 2021-12-07 17:43:26
与FastRP或Node2Vec相比,FastRP和Node2Vec花很长的时间是正常的。从GDS 1.7开始,您可以使用
CALL gds.beta.listProgress(jobId: String)
YIELD
jobId,
taskName,
progress,
progressBar,
status,
timeStarted,
elapsedTime如果您调用而不传入jobId,它将返回所有正在运行的作业的列表。如果使用jobId调用,它将给出有关正在运行的作业的详细信息。
此查询将总结作业03d90ed8-feba-4959-8cd2-cbd691d1da6c的详细信息。
CALL gds.beta.listProgress("03d90ed8-feba-4959-8cd2-cbd691d1da6c")
YIELD taskName, status
RETURN taskName, status, count(*)https://stackoverflow.com/questions/70260290
复制相似问题