我已经下载了yago.n3数据集
但是,为了测试,我希望使用较小版本的数据集(因为数据集是2 GB),即使我做了很小的更改,也需要花费大量时间进行调试。
因此,我尝试复制一小部分数据并创建一个单独的文件,但这并不起作用,并抛出了词法错误。
我看过之前的帖子,然而之前的帖子是关于大数据集的,而我正在搜索较小的。
有没有什么方法可以让我获得更少的相同数据集?
发布于 2012-05-25 14:20:26
如果您手头有一个RDF解析器来读取您的yago.n3文件,那么您可以解析它并在一个单独的文件上写入您想要/需要的任意多个RDF三元组,以便您的较小数据集运行您的实验。
如果你找到一些N- triple格式的数据(即每行一个RDF三元组),你可以任意多的取行,并使你的数据集尽可能小: head -n 10 filename.nt会给你一个10个三元组的小数据集。
https://stackoverflow.com/questions/10746406
复制相似问题