在我的实验中,我使用的是WordNet18数据,它包含形式为(主语、谓语、宾语)的三元组,下面是一些示例:
03964744 _hyponym 04371774 00260881 _hypernym 00260622 02199712 _member_holonym 02188065
我想知道实体I,如03964744,代表什么。有谁知道如何解码这些实体吗?
提前谢谢你。
发布于 2017-06-27 16:35:53
您看到的8位数字可能是数据文件中条目的字节偏移量。请参阅http://wordnet.princeton.edu/wordnet/man/wnintro.5WN.html
经过相当多的搜索之后,我认为您看到的是WordNet 3.0的数字(给定同义词集的字节偏移量在不同版本之间是不同的;3.1是最新版本)。
您的第一个条目似乎是说swing是一种玩具:
http://compling.hss.ntu.edu.sg/omw/cgi-bin/wn-gridx.cgi?usrname=&gridmode=grid&synset=04371774-n&lang=eng&lang2=eng
http://compling.hss.ntu.edu.sg/omw/cgi-bin/wn-gridx.cgi?synset=03964744-n
https://stackoverflow.com/questions/44715734
复制相似问题