首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >从包含N-三元组文件的归档文件生成TDB数据集

从包含N-三元组文件的归档文件生成TDB数据集
EN

Stack Overflow用户
提问于 2014-09-08 18:04:19
回答 1查看 161关注 0票数 0

事先为可能出现的重复表示歉意。

我有一个包含117,426个文件的存档(每个文件都是N-TRIPLES格式的),希望加载到TDB数据集的默认图表中。由于文件数量众多,我需要能够执行此导入,而无需手动选择要上载的单个文件。

我在Bash,Jena和Fuseki发行版可供我使用。

如果可能的话,我希望避免只编写一个java应用程序来完成这一最坏的情况。如果我必须为此编写一个java应用程序,那么RIOT/TDB中存在哪些钩子来执行编程的大容量加载?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-09-08 18:48:17

作为一个基因注释,一种方法是连接N文件以生成一个文件。

您可以同时使用tdbloadertdbloader2加载多个文件。

代码语言:javascript
复制
tdbloader --loc DB ... your files ...

117,426可能会使您的操作系统承受单一命令行调用的压力。您可以将文件导入tdbloader (就像先连接文件一样)。

代码语言:javascript
复制
... | tdbloader --loc DB -- -

其中,...是获取bash来对文件进行猫化的某种方式(可能是从子subshell)。

例如(您需要调整到所有117,426个文件):

代码语言:javascript
复制
( for x in data*.nt
  do
    cat $x 
  done
) | tdbloader --loc DB -- -
票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/25730414

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档