我有个问题。我可以理解,网页只能由人类来解释,而不是由机器来解释。因此,我们创建词汇表和语义,并以有向图格式表示rdf中的信息,这样机器甚至可以解释它。我们有主谓和宾语,主语、谓语和宾语可以是uris。但我感到困惑的是,我们是否应该有一个对应于网站每一页的rdf,这样人类才能看到网页,而机器却可以使用rdf版本。我说的对吗?
此外,我也看到,使用本体工程,我们产生的规则使用关联规则分析。我在这件事上也有些困惑。让我说,我想为一个领域创建一个本体,比如说医学。然后利用关联规则挖掘来挖掘网站或其他数据来获取关联。但是这样做,我只能定义概念之间的关系。如何使用这种挖掘来获得一个新的概念?
此外,我们如何使用新创建的本体论。我们应该怎么把它们添加到网站上呢?我不太清楚。那么需要一些建议吗?
发布于 2012-04-06 14:11:16
但我感到困惑的是,我们是否应该有一个对应于网站每一页的rdf,这样人类才能看到网页,而机器却可以使用rdf版本。我说的对吗?
RDF是一种数据模型,与关系模型一样,可以用于存储各种信息。它不需要附加到一个网页。事实上,它甚至可以独立于Web而存在。网页可能会将RDF数据直接嵌入到HTML代码中(使用RDFa),因此您不一定需要对人和机器进行不同的表示。HTML页面可以与RDF数据完全分离,但机器可以以不同的方式指向正确的位置,例如,通过网页标题中的链接或使用语义站点地图。
在链接数据圈中,必须使用HTTP来标识它们。当您查找URI时,您应该得到对事情的描述,在本例中,为需要它的软件应用程序提供RDF和向与人交互的用户代理(例如Web浏览器)提供HTML是很好的做法。例如,如果您使用Web浏览器访问http://dbpedia.org/resource/Lyon,则会得到这。如果使用Web爬虫访问相同的URI,则可能会得到那。
如何使用这种挖掘来获得一个新的概念?
本体工程和规则挖掘是不同的东西。通常,本体是在没有规则挖掘的情况下设计的。概念通常产生于希望为某一特定目的设计本体的人之间的协议。但是,可以猜测挖掘过程中的新概念,可能是文本挖掘或关联规则挖掘。但这与如何使用本体论无关。
此外,我们如何使用新创建的本体论。
大多数情况下,您使用本体论的术语即可使用本体论。例如,假设你想描述Jim,一个全名为JamesD.Goo的人。在RDF中,您知道您使用URI来标识事物,所以您需要为Jim提供一个URI,比如http://yourdomain.com/jim,缩写为yd:jim以表示简洁(为此您必须决定自己的URI方案)。现在你想说吉姆是一个人。为此,您有一个特殊的预先定义的谓词rdf:type
yd:jim rdf:type <aClassThatRepresentsPeople> .现在,您可以为<aClassThatRepresentsPeople>创建自己的新URI,但这正是本体发挥作用的地方。这类人将被一次又一次地重复使用,所以您希望它是一个被许多人共享的术语。要使用本体术语,只需编写它的URI即可。您不需要任何特殊的解释术语来源的东西,也不需要一个导入语句。由于URI应该是通用的,所以很明显,您使用的术语与本体中定义的术语完全相同。此外,如果本体遵循链接数据最佳实践,那么类的URI应该是不可引用的,因此当您使用HTTP查找URI时,您将得到该术语的定义。吉姆的名字也是一样。您可以在RDF中这样说:
yd:jim <theNameAttribute> "James D. Goo" .在这里,您不需要名称本身的URI,它只是一个字符串(虽然可以给它一个标识符,以便您可以将其分解为名字、中间名、姓氏等等)。同样,对于<theNameAttribute>,您只需重用本体中定义的属性。最后,你可能会看到这样的东西:
yd:jim rdf:type foaf:Person .
yd:jim foaf:name "James D. Goo" .其中,foaf:是FOAF本体的前缀,它是在线描述人的一个流行的前缀。
我们应该怎么把它们添加到网站上呢?
不是真的,而是在一定程度上是的。您可以重用现有的本体(如FOAF),它可以在一个完全不同的网站上找到。这就是网络和链接数据的美妙之处:它是分布式和模块化的。但是,如果您使用自己的本体(例如http://yourdomain.com/ontology),则应该通过取消引用来访问此本体,也就是说,如果您查找本体的术语(例如,http://yourdomain.com/ontology#person),则您的服务器应该响应对本体的描述或至少对所请求的术语的描述。您只需按照将任何文件添加到您的网站的方式添加本体即可。
https://stackoverflow.com/questions/9945203
复制相似问题