有很多词干库,但它们在其他语言中,但我需要一个API或库或算法,将用于词干乌尔都语单词。我想找到一个词的词根,比如英语。
悲伤=>悲伤
发布于 2015-05-16 19:56:07
有多个库和扩展可用于此任务。
扩展
茎部
php-词干机
https://github.com/hthetiot/php-stemmer
图书馆
这些语言库也将完成这项工作(至少对于英语部分是这样):
PHP Morhpy
http://phpmorphy.sourceforge.net/dokuwiki/
--
乌尔都语是一种混合语言。因此,“基本”波特词干是不够的(而且可能只满足于乌尔都语的英语部分)。你必须建立语言规则的模型。对于NLP来说,乌尔都语是一个挑战,因为它有着丰富的形态学。
如果您想要实现一个基于规则的词干器,那么请看本文,它解释了使用的algo : Vaishali,Nisheeth,Iti所使用的"乌尔都语基于规则的Stemmer语言“。
https://stackoverflow.com/questions/30280006
复制相似问题