我想问你是否知道任何开源的java实现的lemmatizer。或者,如果不是开源的,至少是任何java实现的词法分析器,可以在不支付许可证费用的情况下使用。
发布于 2012-12-06 23:29:52
你试过GATE吗?它是用Java编写的。它的大部分是纯Java的,有些部分只是对其他东西的Java包装器。它可能有一个用于你想要词汇化的语言或文本类型的插件。
http://gate.ac.uk/gate/doc/plugins.html
它应该被认为是研究的质量,但它的高度特色。几年前,我在我的NLP课程上用它做了一个问答系统。
(同样由我的母校谢菲尔德大学制作!:D)
发布于 2012-12-06 23:39:37
Stanford NLP包执行词汇化。它是在GNU通用公共许可证下获得许可的。
有关更具体的信息,请参阅Stanford NLP site。
https://stackoverflow.com/questions/13746824
复制相似问题