什么代表了最先进的词义消歧软件(WSD)?哪些指标决定了最先进的状态,哪些工具包/开源包可用?
发布于 2012-01-10 19:03:47
我的清单并不是详尽无遗的,但谷歌搜索更多肯定会更符合你的目的。
对于软件,这里是一个简短的列表,请记住引用的相关来源!
GWSD:基于无监督图的词义消歧 http://lit.csci.unt.edu/~rada/downloads/GWSD/GWSD.1.0.tar.gz
SenseLearner:全词词义消歧工具 http://lit.csci.unt.edu/~rada/downloads/senselearner/SenseLearner2.0.tar.gz
基于京都UKB图的WSD http://ixa2.si.ehu.es/ukb/
pyWSD: https://github.com/alvations/pywsd简单WSD算法的Python实现
WSD任务在某种程度上也依赖于数据源,因此这里有几个,请记住也引用!
开放思维词专家感知标记数据 http://teach-computers.org/word-expert.html
TWA感知标记数据 http://lit.csci.unt.edu/~rada/downloads/TWA/TWA.tar.gz
SemCor http://lit.csci.unt.edu/~rada/downloads/semcor/semcor1.6.tar.gz
最后,WSD任务依赖于某些预处理,如果您正在研究最先进的跨语言WSD,那么您应该尝试寻找像这样的字级对齐器。
另外,看看以前的Senseval/SemEval页面,看看已经做了什么,以及未来任务正在朝着什么方向发展。http://en.wikipedia.org/wiki/SemEval
https://stackoverflow.com/questions/4613773
复制相似问题