我想要得到不同语言的主要新闻网站的列表。有没有以RDF格式提供大多数主要网站详细信息的供应商?
发布于 2013-05-31 01:20:13
DBpedia包含来自维基百科的信息,并具有SPARQL端点。维基百科中有一些相关的类别,可以帮助你找到你正在寻找的信息。例如,我们可以选择单个新闻网站并获得302个结果:
SELECT * WHERE {
?newsSite dcterms:subject category:News_websites .
} SPARQL results
要可靠地获取其他信息就有点困难了,因为一些信息可能对页面不可用,或者相同的信息可能出现在具有不同属性的不同页面上。例如,其中一些页面使用dbpprop:web记录他们的新闻站点
SELECT * WHERE {
?newsSite dcterms:subject category:News_websites .
OPTIONAL { ?newsSite dbpprop:web ?web }
}SPARQL results
其他人使用dbpprop:website。您可以只将前面查询中的dbpprop:web替换为dbpprop:web|dbpprop:website,尽管这在DBpedia端点上的运行速度有点慢。您可以更详细地使用下面的代码:
SELECT ?newsSite ?web WHERE {
?newsSite dcterms:subject category:News_websites .
OPTIONAL {
{ ?newsSite dbpprop:web ?web }
UNION
{ ?newsSite dbpprop:website ?web }
}
} SPARQL results
这仍然只能为其中的一小部分页面提供网站。更多的人使用dbpprop:url,因此我们有以下内容:
SELECT ?newsSite ?web WHERE {
?newsSite dcterms:subject category:News_websites .
OPTIONAL {
{ ?newsSite dbpprop:web ?web }
UNION
{ ?newsSite dbpprop:website ?web }
UNION
{ ?newsSite dbpprop:url ?web }
}
} SPARQL results
https://stackoverflow.com/questions/15545509
复制相似问题