首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >lucene对常见NLP任务的支持

lucene对常见NLP任务的支持
EN

Stack Overflow用户
提问于 2012-12-15 01:22:29
回答 1查看 373关注 0票数 0

我正在做一个文本挖掘项目,计划稍后集成Lucene。我目前的实现使用openNLP来执行常见的自然语言处理任务,例如标记化,构建n元语法特征。我很想知道Lucene是否可以支持这些功能?与openNLP相比,Lucene能够实现大规模文档收集的高效率吗?

EN

回答 1

Stack Overflow用户

发布于 2012-12-18 06:20:31

  1. Lucene提供标记化和n元语法分析。
  2. 如果您的Lucene文档有一个或多个类别,那么您可以通过计算您的命中落入的每个类别的数量,然后将命中最多的类别作为您的查询类别来实现Hyperpipes分类器。(我相信您还可以实现其他分类器--

恰好是因为它是从使用搜索引擎中脱颖而出的,因为implement是一个库,您可以通过图形用户界面、命令行程序或服务(守护进程)使用它。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/13883433

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档