我在一个TTL文件中有一个包含220毫安三倍的数据集。有办法把这些数据上传到AnzoGraph吗?
在AnzoGraph文档https://docs.cambridgesemantics.com/anzograph/userdoc/load-reqs.htm中,我看到了下面的文本:
AnzoGraph支持最大URI长度为16K字符。您可以加载到AnzoGraph中的唯一URI的数量也有64K的限制。也就是说,可以加载到AnzoGraph中的唯一URI(包括图URI和谓词URI)的数量必须小于64K。如果超过此限制,超过此限制的加载操作将失败,AnzoGraph将返回消息"m_lowest_unused_index <= a_max_value()“。
与64K的独特三倍,我期待上传220毫安三倍失败。特别是因为它是一个链接数据集,链接了多个源,所以有很多唯一的URI。
有办法绕过这个限制吗?
发布于 2020-09-04 19:20:25
220毫安三倍,在一个TTL文件中。
这种方法将非常缓慢地加载您的TTL数据,因为您将只使用一个CPU核心来摄取这些数据。如果您只需将数据加载到例如<yourgraph>中一次,那么使用以下命令
`COPY <yourgraph> TO <dir:/mydir/myfiles.ttl.gz>`它将您的数据集拆分成许多gzip压缩的TTL文件,并在下次从该数据目录加载数据MPP样式时,使用AnzoGraph服务器/集群中的每个C{U核并行加载数据子集。我还应该指出,2.2亿个三元组实际上是AnzoGraph的一个非常小的数据集。我在我的T470s Thinkpad上加载了超过1亿台,而仅仅是摆弄一下,单服务器级系统就可以轻松地处理数十亿美元,而几年前,一个大型集群已经被测试到超过1万亿台,并创下了破纪录的LUBM。典型的生产用例在10亿美元中的10%。
免责声明:我为剑桥语义学工作。
https://stackoverflow.com/questions/63187486
复制相似问题