在wordnet.princeton.edu上似乎没有变化或类似的东西。
发布于 2015-10-26 14:17:26
要添加到@abarisone的答案中,实际的同步ID本身可以在WordNet 3.0和WordNet 3.1之间有所不同:(
例如,在WordNet 3.1中,的椅子是103005231-n。
然而,在WordNet 3.0中是103001627-n.但是您不能在http://wordnet-rdf.princeton.edu/wn31/103001627-n或http://wordnet-rdf.princeton.edu/wn30/103001627-n中查找这一点,而是需要使用错误地重定向到102992974-n的http://wordnet-rdf.princeton.edu/wn30/03001627-n。
我认为这是WordNet RDF3.1在线应用程序中的一个bug,因为102992974-n并不正式存在。你甚至不能搜索它(在线和离线)。如果在该页面上获得RDF/JSON文件,它将为您提供103005231-n.
在wn3.1.dict/dict/index.noun中:
chair n 5 4 @ ~ %p + 5 2 03005231 00599171 10488547 03275941 03005700 文件中任何地方都没有提到02992974。
这两个问题都令人困惑。我想知道为什么它们在小的修订中更改了同步ID。
关于WordNet同步ID的状态:
结论:目前使用WordNet 3.0同步ID是最安全的。
对于未来的工作,可以考虑使用来自全球Wordnet协会的语际索引(即将到来)。它将具有与Wordnet3.0兼容的ID。
出发地:拉斐尔,尼古拉斯 URI是从“dblocation”字段构建的,该字段是与相关的基于字符的数据库文件开头的字节偏移量(我不确定是哪个)。随着项目被移除、添加和移动,这将从一个版本更改到另一个版本。
。
出发地:彼得·克拉克 据我所知,…。FYI一个鲜为人知的事实是,感测键(例如,“异能%1:07:00::”)在发行版之间是稳定的,除非感官被拆分或合并。这为跨版本引用同步集提供了一种稳定的方法,而不是使用同步编号。此外,通过查找相同的感觉键,可以在不同版本中找到同步数之间的映射。(sensekey->synset是一个多到1的映射:一个同步集可能有多个感觉键,每个同步集中的word+sense都有一个。但感觉键正好映射到一个同步集)。最美好的祝愿,皮特
。
出发地: John McCrae 你好,亨迪, 是的,WordNet同步集标识符基于给定版本的WordNet中描述符的字节偏移量,因此它们在不同版本的WordNets中并不稳定。意义标识符更稳定,但仍然不可靠,因为sense确实会被拆分和合并。另外,WordNet 3.1有两个稍微不同的版本,WordNet RDF版本接受来自.当然,正如其他人所评论的那样,这一切都很令人困惑。 出于这个原因,全球WordNet协会已经开始了一个语言间索引的工作,我们预计这个索引很快就会上线(即,为一月份的全球WordNet会议提供时间),并将为每个同步集提供一个不变的URI。 Piek最近做了一次很好的讨论,下面的幻灯片是在线的:http://ldl2014.org/slides/Vossen-LOD-CILI.pdf 目前,我建议使用WN3.0标识符来链接同步集,WordNet语言间索引也将建立在此基础之上。 你好,约翰
发布于 2015-09-24 12:48:38
如果在WordNet当前版本部分下面查找,您会发现:
WordNet的最新版本是2.1,发布于2005年3月。Unix/Linux/Solaris/等版本3.0于2006年12月发布。3.1版目前仅在网上提供。
此外,谈到3.0版和3.1版之间的区别,您可以阅读:
仅限WordNet 3.1数据库文件 您可以从这里下载WordNet 3.1数据库文件。注意,这不是上面提到的完整包,也不包含任何运行WordNet的代码。但是,您可以用这些文件替换3.0本地安装的数据库目录中的文件,然后运行WordNet接口,从3.1数据库返回条目。这只是WordNet 3.1数据库文件的压缩tar文件。
因此,区别在于WordNet 3.1只在线,但您可以替换3.0版本数据库并使用本地安装。
您可以找到关于3.0版这里的文档。
https://stackoverflow.com/questions/32423369
复制相似问题