事先为可能出现的重复表示歉意。
我有一个包含117,426个文件的存档(每个文件都是N-TRIPLES格式的),希望加载到TDB数据集的默认图表中。由于文件数量众多,我需要能够执行此导入,而无需手动选择要上载的单个文件。
我在Bash,Jena和Fuseki发行版可供我使用。
如果可能的话,我希望避免只编写一个java应用程序来完成这一最坏的情况。如果我必须为此编写一个java应用程序,那么RIOT/TDB中存在哪些钩子来执行编程的大容量加载?
发布于 2014-09-08 18:48:17
作为一个基因注释,一种方法是连接N文件以生成一个文件。
您可以同时使用tdbloader或tdbloader2加载多个文件。
tdbloader --loc DB ... your files ...117,426可能会使您的操作系统承受单一命令行调用的压力。您可以将文件导入tdbloader (就像先连接文件一样)。
... | tdbloader --loc DB -- -其中,...是获取bash来对文件进行猫化的某种方式(可能是从子subshell)。
例如(您需要调整到所有117,426个文件):
( for x in data*.nt
do
cat $x
done
) | tdbloader --loc DB -- -https://stackoverflow.com/questions/25730414
复制相似问题