首先,这个问题看起来很简单:给定两个本体论,本体论A中哪个术语最好是指本体论B中的一个术语,但它的简单性是欺骗性的:这个问题极其困难,目前已经导致成千上万的学术出版物,对于如何解决这个问题还没有达成任何共识。
天真地,人们会期望在两个本体论中只看一下“心脏病发作”这个术语就足够了。然而,本体论几乎从不对同一短语进行编码。在简单的情况下,“心脏病”可能被编码为“心脏病”,或“心脏病(非致命)”,但在更复杂的情况下,它可能只被编码为“心肌梗死”。在其他情况下,它甚至更复杂,例如处理复合(合成)术语。
更重要的是,简单地匹配术语(或字符串)忽略了“本体论结构”。如果本体A中的“心脏病”编码为caused-by高血压,而在本体B中则可能编码为withdrawl-from-trial-non-fatal。在这种情况下,匹配这两个术语可能是有效的,但并不是微不足道的。这假设有一个等价的术语存在。
这是一个被称为语义/本体匹配、对齐或协调的经典问题。研究内容包括词汇相似性、自由文本中的术语使用、图同态、映射(如网格/WordNet)、主题建模和逻辑推理(一阶或高阶逻辑)。但是,哪个是最友好的、最适合生产的解决方案,可以集成到/Clojure或Python中呢?我看过本体匹配:文献综述,但他们似乎不推荐任何东西.有什么建议或经验吗?
发布于 2015-08-10 20:00:58
看看http://oaei.ontologymatching.org/2014/results/。有几个轨道开放,以供匹配者被发送和评估。不是每一位选手都参加每一场比赛。因此,您可能需要阅读轨道描述,并选择一个似乎是最类似于您的问题。例如,如果您不需要处理多种语言,您可能不需要检查MultiFarm跟踪。然后,通过查看Recall、Precision和F-Measure来检查结果,然后自己决定。你也可能想看看前几年。
https://stackoverflow.com/questions/31809742
复制相似问题