我正在通过一个关于文本简化的项目,有几个开放源码提供了文本解析器,如斯坦福解析器。
发布于 2012-07-08 12:22:49
为此,OpenNLP是一个非常好的开源库。您可以使用许多特定的机器学习算法(如MaxEnt )来训练此库以生成特定于您需求的模型。您还可以看到此discussion。
虽然OpenNLP使用的是Apache license,但还有另一个名为LingPipe的工具,它也提供类似的功能,但许可不同。
然而,Mahout也是一个很好的机器学习库,因此您需要使用其他解析器或您自己的实现从文本中提取特征。Mahout需要用于学习的功能。
教程: 1. OpenNLP Tutorials 2. LingPipe Tutorials
https://stackoverflow.com/questions/11380468
复制相似问题