我正在做一个文本挖掘项目,计划稍后集成Lucene。我目前的实现使用openNLP来执行常见的自然语言处理任务,例如标记化,构建n元语法特征。我很想知道Lucene是否可以支持这些功能?与openNLP相比,Lucene能够实现大规模文档收集的高效率吗?
发布于 2012-12-18 06:20:31
恰好是因为它是从使用搜索引擎中脱颖而出的,因为implement是一个库,您可以通过图形用户界面、命令行程序或服务(守护进程)使用它。
https://stackoverflow.com/questions/13883433
复制相似问题