首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Lucene librairy for purify a text (复数,动词...)

Lucene librairy for purify a text (复数,动词...)
EN

Stack Overflow用户
提问于 2017-08-07 03:14:51
回答 1查看 31关注 0票数 1

我希望在我的Java应用程序中使用Lucene来简化文本。

我自己已经做过了,但是我没有动词和复数的解决方案。

我该如何处理?

EN

回答 1

Stack Overflow用户

发布于 2017-08-07 03:43:27

如果我对您的问题理解正确,您希望从文本中检测名词/动词。AFAIK Lucene本身无法检测到这一点。您可以改为查看OpenNLP库,它是一个

基于

机器学习的自然语言文本处理工具包

因此,它将使用训练模型等概念,然后进行预测。它有一个POSTagger here (部分语音标签)-你可以在文档中查看它的用法,以及一些详细的例子hereherehere

另一个优秀的Java框架是Stanford Core NLP,您可以查看Stanford Log线性词性标记器here

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/45535666

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档