我希望在我的Java应用程序中使用Lucene来简化文本。
我自己已经做过了,但是我没有动词和复数的解决方案。
我该如何处理?
发布于 2017-08-07 03:43:27
如果我对您的问题理解正确,您希望从文本中检测名词/动词。AFAIK Lucene本身无法检测到这一点。您可以改为查看OpenNLP库,它是一个
基于
机器学习的自然语言文本处理工具包
因此,它将使用训练模型等概念,然后进行预测。它有一个POSTagger here (部分语音标签)-你可以在文档中查看它的用法,以及一些详细的例子here,here和here。
另一个优秀的Java框架是Stanford Core NLP,您可以查看Stanford Log线性词性标记器here
https://stackoverflow.com/questions/45535666
相似问题