我正在做一个NLP项目,我需要识别句子中的概念,以找到其他类似的概念。我这样做是为了从我已经有的列表中推断出单词的价态。我开始使用WordNet,但它给出了许多矛盾的结果。所谓矛盾的结果,我指的是具有矛盾价态的单词扩展。
所以现在我要研究一下ConceptNet和OpenCyc。我已经实现了ConceptNet,这一切都很简单,我喜欢它。问题是,OpenCyc似乎有一个更大、逻辑上更严格的数据库,当我在WordNet上发现这么多“矛盾”时,这一点很重要……但我不知道,因为我还没试过。
有人能告诉我,是否值得(对我来说,是相当大的)努力来实现OpenCyc,或者ConceptNet足够好来推断单词的价态?它们有那么不同吗?
如果需要的话,我很乐意进一步解释。现在试着保持简短!
谢谢!
发布于 2012-01-09 10:37:53
这不值得你费这个力气。ConceptNet要好得多,也更容易处理。
当我使用ConceptNet时,只需下载一个sqlite数据库和一个python模块来访问其中的关系即可。对于OpenCyc来说,这是一个更大的下载,并且必须通过web服务器进行设置,该服务器需要很长时间才能加载,并且使用了大量的内存。从那以后,事情可能发生了变化,但这是我的经验。
https://stackoverflow.com/questions/2644345
复制相似问题