我最近开始了一个关于德语文本的情感分析项目,我计划使用词干分析器来改善结果。
NLTK附带了一个德国雪球Stemmer,我已经尝试过使用它,但我不确定结果。也许应该是这样的,但作为一名计算机科学家而不是语言学家,我对词干不同的动词词尾变化形式有一个问题。
以单词"suchen“(搜索)为例,对于第一人称单数,它的词根是”to“,而对于第三人称单数,它的词根是"sucht”。
我知道也有词汇化,但据我所知,没有工作的德国词汇化被集成到NLTK中。有GermaNet,但他们的NLTK集成似乎已经中止。
开门见山:我希望动词形式的屈折词干是相同的,至少对于相同时态的常规动词是这样的。如果这对我的目标不是一个有用的要求,请告诉我为什么。如果是,您是否知道可以使用哪些其他资源来帮助我实现此目标?
编辑:我忘了提一下,任何软件都应该是免费的,用于教育和研究目的。
https://stackoverflow.com/questions/44522536
复制相似问题