我正在尝试制作一个关于在我的地区跑步的语义web应用程序(10k,半马拉松,马拉松)。更具体地说,我希望收集和发布(在RDF中)有关种族、参与者和结果的数据,并合并类似的数据。在过去的几周里,我一直在测试Jena (包括TDB),在静态网站上做一些关于运行种族和阅读词汇表和本体的web抓取。
我认为我的应用程序使用的最著名的本体,也是进入门槛最低的本体(并不是过度设计的),是英国广播公司的体育本体。http://www.bbc.co.uk/ontologies/sport/2011-02-17.shtml
关于使用BBC体育节目和应用程序,我有几个问题:
我可以使用BBC的体育本体吗,即使我只使用其中的一小部分?
我想看一下本体的模式,以便更好地理解它,但我似乎找不到它。英国广播公司是保守秘密还是我只是在错误的地方寻找它?
有什么方法可以让我确定我是否正确地使用了本体?我的母语不是英语,所以恐怕我可能误解了本体论中的一些概念。
当我向我的(TDB)三重存储添加新的三元组时,为资源创建新URI的约定是什么?更具体地说,URI应该以名称或uid结尾吗?这会影响来自不同数据集的相似数据的合并吗?
您能推荐任何语义web工具来使资源URI不可引用吗?我不会在短期内将应用程序放到网络上,但是如果我能够在本地访问URI的话,还是很好的。
http://localhost/running/12345.发布于 2013-09-26 03:08:25
这里有几个不同的问题,有些问题比其他问题更容易回答。
寻找BBC的本体论
许多BBC网站对文档使用内容协商,您可以通过设置适当的HTTP头来获取您要查找的RDF文档,或者更简单地通过请求具有适当扩展的资源来获得这些文档。例如,本体的人类可读的版本是
若要获得机器可读的版本,请使用
他们这么做的事实并不是显而易见的。据说至少有一个地方是他们的Feeds and Data section of Nature,在那里他们声明:
我怎么得到RDF? 你有几个选择。我们在标准URL上使用content negotiate --如果您是客户端的请求头指定RDF,那么这就是您将得到的。或者,将.rdf添加到URL的末尾,然后返回RDF而不是HTML。
您可以根据需要使用BBC本体中定义的类、属性和个人的数量或数量。这是语义网美的一部分。至于你是否正确地使用了它们,它们中的大多数都有一些描述性的标签,但是标签是用英语的。我不认为有一种自动的方法来检查你的使用情况,恐怕你只需要去找一个更熟悉英语的人。当然,您也可以用自己的语言添加标签和注释,并将其提供给其他人。这是语义网和链接数据的另一个优点,你可以随时随地说出任何关于它的信息。
创建标识符的约定
没有单一的标准来创建IRIs。如果它们是人类可读的,那是很好的,但是如果您正在以编程的方式生成很多东西,这是很难实现的。如果您不能使它们具有可读性,那么至少要确保在可能的情况下为它们提供适当的rdfs:label。在http://answers.semanticweb.com上,有关IRI约定的问题可能更多,如果您问这个问题,您可能会得到更好的答案。
使您的虹膜在本地可以取消。
正如措辞所示,您要求的是一个工具,这类问题对于StackOverflow来说是一个不相关的话题:
要求我们推荐或查找工具、库或最喜爱的场外资源的问题是堆栈溢出的非主题问题,因为它们往往会吸引固执己见的答案和垃圾邮件。相反,请描述这个问题以及到目前为止为解决问题所做的工作。
同样,您在http://answers.semanticweb.com上可能会有更好的运气。不过,简单的回答是,您将寻找一个轻量级的for服务器。您甚至可以通过让web服务器将对IRI的请求转发给SPARQL描述查询,询问有关IRI的信息。这样,当你要求:
http://localhost/running/12345你会得到的结果
describe <http://localhost/running/12345>https://stackoverflow.com/questions/19016270
复制相似问题