我最近安装了RDFLib来处理RDF数据。我想从任何包含非RDF /RDF数据的网页中提取RDF数据,比如Virtuoso Sponger
like this link does
并存储为N-Triples(nt)或N3/Turtle格式(与链接页脚中的选项相同)。如果我执行以下操作,则会收到警告和错误
g.parse("http://www.slideshare.net/kleinerperkins/internet-trends-v1.html",format="n3")另外,有没有内置的RDFLib本体映射功能?
发布于 2015-05-31 02:44:24
如果我执行以下操作,将收到警告和错误
g.parse("http://www.slideshare.net/kleinerperkins/internet-trends-v1.html",format="n3")
这并不奇怪,因为您实际上是在请求它使用n3解析器解析HTML页面。
你可以跑
g.parse("http://www.slideshare.net/kleinerperkins/internet-trends-v1.html", format="html")但这可能也不是您想要的。RDFLib可以处理嵌入在超文本标记语言(如RDFa或微数据)中的RDF,也可以从超文本标记语言中提取一些“通用RDF”,但结果与你从uriburner得到的结果有很大不同。原因是它使用了一个自定义的" slideshare“Virtuoso Sponger,它是为从slideshare HTML中提取更多有用的信息而量身定制的。如果您想要使用放入特殊sponger中知识,您可以通过解析来自uriburner的RDF版本来“通过”uriburner查询页面(链接可以在the page的底部找到):

g.parse(
'http://linkeddata.uriburner.com/sparql?default-graph-uri=http%3A%2F%2Fwww.slideshare.net%2Fkleinerperkins%2Finternet-trends-v1&query=DESCRIBE%20%3Chttp%3A%2F%2Flinkeddata.uriburner.com%2Fabout%2Fid%2Fentity%2Fhttp%2Fwww.slideshare.net%2Fkleinerperkins%2Finternet-trends-v1%3E&output=text%2Frdf%2Bn3',
format='n3'
)https://stackoverflow.com/questions/30540561
复制相似问题