我想实现一个语音搜索使用Lucene 6.1.0。,使用Soundex或任何适用于葡萄牙语的算法。我在互联网上发现了许多不完整的例子,教你如何实现一个自定义的标记器,分析器,但在6.1.0版本中,这些例子上使用的抽象类似乎并不相同。谁能告诉我在哪里可以找到一个好的Lucene文档,而不仅仅是java文档,而不是没有任何进一步的文档来指导如何将这些东西组合在一起?
提前谢谢。
发布于 2016-07-27 06:09:00
Analyzer documentation展示了如何创建您的分析器。
对于语音分析,您应该查看编解码器包(您需要在构建路径中添加“lucene-analyzers- org.apache.lucene.analysis.phonetic -6.1.0.jar”,以及Apache的"commons-codec-1.10.jar",您可以使用get here)。
然后你可以设置你的分析器,例如:
Analyzer analyzer = new Analyzer() {
@Override
protected TokenStreamComponents createComponents(String fieldName) {
Tokenizer tokenizer = new StandardTokenizer();
TokenStream stream = new DoubleMetaphoneFilter(tokenizer, 6, false);
return new TokenStreamComponents(tokenizer, stream);
}
};https://stackoverflow.com/questions/38599692
复制相似问题