我想根据分类(类别/倾斜度等)对文本中的单词进行着色。我有一本功能齐全的字典,但问题是其中有很多歧义。例如,条约可以是动词"fornicate“或名词”foedere“的形式。
解决这些歧义或生成好的猜测的一般策略是什么?
谢谢!
发布于 2010-10-17 22:43:25
一般的策略是首先对数据运行part-of-speech tagger,以确定单词类别(名词、动词等)。然而,这需要数据(上下文统计)和工具。This research paper可能是一个起点。
https://stackoverflow.com/questions/3953577
复制相似问题