首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在装入apache-jena TDB triplestore之前对YAGO文件进行消毒。

在装入apache-jena TDB triplestore之前对YAGO文件进行消毒。
EN

Stack Overflow用户
提问于 2016-09-23 15:47:11
回答 1查看 335关注 0票数 3

我想使用tdbloader将YAGO 3 rdf三元组(从yago3_entire_ttl.7z到http://www.mpi-inf.mpg.de/departments/databases-and-information-systems/research/yago-naga/yago/downloads/ )使用到apache (3.1.0)中。

apache提供的验证输入的防暴工具提供了两种类型的错误(多次发生):

  1. 非法unicode转义序列值:\ (0x5C)
  2. IRI中的非法字符(代码点0x7C,“AC.26”)

我明显的想法是用通过防暴验证的可接受的字符序列替换'\‘和’\‘,但是我想知道是否还有其他的解决方案?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-04-20 09:34:58

在这里找到了一个解决方案:

现在,.ttl文件需要进行某种预处理,替换非unicode字符,以便Jena接受数据。在Linux上,从您的-i文件所在的目录中运行sed -i的/-/-/g‘./* & sed -i 's/\/-/g’./ && sed -i‘s/-/g’./*。在Windows上,启动Ubuntu,导航到相应的目录(例如/mnt/c/Users/Ferdinand/yago)并执行相同的命令。这需要几分钟。我是说,真的有好几个..。

https://ferdinand-muetsch.de/how-to-load-yago-into-apache-jena-fuseki.html

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/39664819

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档