请告诉我如何更好地解决这个问题。
我有俄文,我想找10个最常见的词与形态学。也许在python中有任何开源库来解决这个问题。
发布于 2013-04-12 12:52:12
您可以使用俄语的Python形态学分析器之一来规范这个词:
在https://github.com/nltk/nltk里也有一台可供俄国人使用的波特树干机。此外,您还可以从命令行使用http://company.yandex.ru/technologies/mystem/。
我推荐pymorphy2来执行您的任务,但我有一点偏见:)
发布于 2013-04-12 12:51:48
PyStemmer和NLTK是这里两个明显的库。
https://stackoverflow.com/questions/15971578
复制相似问题