Conceptnet包含两种基本类型的节点,单词(例如/c/en/cat)和意义(例如/c/en/cat/n/Conceptnet_cat)。不幸的是,绝大多数边都使用单词节点。这使得推断变得很困难,因为我不能确定单词对单词的边缘指的是哪种意义。
例如,Conceptnet包含使用单词“猫”的9种含义,大多数是专有名词(/c/en/cat/n/musical、/c/en/cat/n/magazine、/c/en/cat/n/a_spiteful_cat_gossip等)。如果一条边说"/c/en/cat /r/HasA /c/en/tail",我根据自己的经验知道这可能指的是/c/en/cat/n/HasA_cat,没有其他含义。然而,如果我看到一条边显示"/c/en/cat /r/IsA /c/en/fun_ to _watch",我知道它可能指的是/c/en/cat/n/musical,但它也可能指的是/c/en/cat/n/ edge _cat。
如何自动执行此过程?如何翻译只使用单词节点的边,以便它们使用sense节点?
发布于 2017-09-30 01:57:51
ConceptNet似乎不包含任何词义消歧,请参阅它们的FAQ
到目前为止,
ConceptNet只做了最小的词义区分--在ConceptNet 5.5的内置图表中,词义只通过它们的词性来区分(类似于sense2vec)。WordNet对每个单词都有大量的意义,尽管其中一些在实践中很难区分。
https://stackoverflow.com/questions/25449948
复制相似问题