首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >基于词频的最大编辑距离与建议

基于词频的最大编辑距离与建议
EN

Stack Overflow用户
提问于 2011-05-02 13:51:33
回答 2查看 911关注 0票数 9

我需要一个具有以下规格的拼写检查器:

  • 可扩展性很强。
  • 以便能够为建议的单词设置最大编辑距离。
  • 根据提供的单词频率(最常见的单词优先)获得建议。

我看了亨法斯特:

我在man中找到了参数MAXDIFF,但似乎不像预期的那样工作。也许我用错了

文件t.aff

代码语言:javascript
复制
MAXDIFF 1 

文件dico.dic

代码语言:javascript
复制
5  
rouge  
vert  
bleu  
bleue  
orange  
代码语言:javascript
复制
NHunspell.Hunspell h = new NHunspell.Hunspell("t.aff", "dico.dic");
List<string> s = h.Suggest("bleuue");

返回t.aff是否为空的相同内容:

代码语言:javascript
复制
bleue
bleu
EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2012-01-09 21:23:30

我们决定使用Apache Solr,这正好满足了我们的需要。

http://wiki.apache.org/solr/SpellCheckComponent#spellcheck

票数 3
EN

Stack Overflow用户

发布于 2011-11-06 07:34:17

一个人的上限应该返回几个,但仍然可以返回多个。

即使是零的最大值也能给出一个以上的结果,但它应该会降低变化。这取决于N克。尝试一个零减结果的最大值,但这仍然不能保证你会得到一个建议。

为了对最常用的单词进行排序,Google ngram语料库是公开可用的。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/5857979

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档