首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >寻找获取较小rdf (n3)数据集的方法

寻找获取较小rdf (n3)数据集的方法
EN

Stack Overflow用户
提问于 2012-05-25 06:52:32
回答 1查看 241关注 0票数 0

我已经下载了yago.n3数据集

但是,为了测试,我希望使用较小版本的数据集(因为数据集是2 GB),即使我做了很小的更改,也需要花费大量时间进行调试。

因此,我尝试复制一小部分数据并创建一个单独的文件,但这并不起作用,并抛出了词法错误。

我看过之前的帖子,然而之前的帖子是关于大数据集的,而我正在搜索较小的。

有没有什么方法可以让我获得更少的相同数据集?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2012-05-25 14:20:26

如果您手头有一个RDF解析器来读取您的yago.n3文件,那么您可以解析它并在一个单独的文件上写入您想要/需要的任意多个RDF三元组,以便您的较小数据集运行您的实验。

如果你找到一些N- triple格式的数据(即每行一个RDF三元组),你可以任意多的取行,并使你的数据集尽可能小: head -n 10 filename.nt会给你一个10个三元组的小数据集。

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/10746406

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档