我想通过使用g.io(<name file>).read().iterate()加载两个文件:nodes.xml和edges.xml。
nodes.xml文件包含我想上传的图形的节点,其内容如下:
<?xml version='1.0' encoding='utf-8'?>
<graphml xmlns="http://graphml.graphdrawing.org/xmlns" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://graphml.graphdrawing.org/xmlns http://graphml.graphdrawing.org/xmlns/1.0/graphml.xsd">
<key id="labelV" for="node" attr.name="labelV" attr.type="string" />
<key id="name" for="node" attr.name="name" attr.type="string" />
<key id="age" for="node" attr.name="age" attr.type="int" />
<graph id="G" edgedefault="directed">
<node id="1">
<data key="labelV">person</data>
<data key="name">marko</data>
<data key="age">29</data>
</node>
<node id="2">
<data key="labelV">person</data>
<data key="name">vadas</data>
<data key="age">27</data>
</node>
</graph>
</graphml>edges.xml文件包含了我想上传的图形的边缘,其内容如下:
<?xml version='1.0' encoding='utf-8'?>
<graphml xmlns="http://graphml.graphdrawing.org/xmlns" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://graphml.graphdrawing.org/xmlns http://graphml.graphdrawing.org/xmlns/1.0/graphml.xsd">
<key id="labelE" for="edge" attr.name="labelE" attr.type="string" />
<key id="weight" for="edge" attr.name="weight" attr.type="double" />
<graph id="G" edgedefault="directed">
<edge id="7" source="1" target="2">
<data key="labelE">knows</data>
<data key="weight">0.5</data>
</edge>
</graph>
</graphml>我想上传节点,首先通过运行g.io('nodes.xml').read().iterate()和来上传,然后通过运行g.io('edges.xml').read().iterate()来上传边缘。但是当我上传edges.xml时,它不是向先前创建的节点添加边缘,而是创建新的节点。
使用Gremlin中的类似命令,可以轻松地先加载节点,然后在单独的查询中加载边缘。我知道这可以通过复杂的查询来实现,这些查询涉及通过用户查询逐条读取和创建edges.xml文件中的边缘,但我想知道是否有更简单的方法。另外,我不想上传一个包含所有节点和边缘的文件。
发布于 2022-03-17 12:12:55
恐怕GraphMLReader不是那样工作的。它的设计并不是为了读取现有的图表。老实说,我不记得这件事是故意的还是非故意的。
不过,代码并不太复杂。你可能只需要修改它就行了他们想要的方式。您可以看到这里,其中代码检查id的顶点缓存。该缓存在第二次执行时是空的,因为它只通过添加新的顶点来填充--它不记得第一次运行时的任何缓存,也不会在第二次运行时直接从图中读取。只需将其更改为逻辑,以更好地满足您的需要。
https://stackoverflow.com/questions/71511865
复制相似问题