首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用Ruby的数据质量

使用Ruby的数据质量
EN

Stack Overflow用户
提问于 2013-12-20 13:54:30
回答 2查看 202关注 0票数 0

我正在寻找任何能帮助匹配两个单词和拼写错误的库。例如,gem应该将以下语句标记为true (这只是一个示例,没有必要扩展标准字符串)

代码语言:javascript
复制
'Start' == 'Strat'
'woodpecker' == 'Wodpekcer'

任何用于数据质量检查的红宝石?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2013-12-20 14:18:04

你知道莱文的事吗?

https://github.com/anjlab/rubyfish只是你可以安装的一个创业板

票数 0
EN

Stack Overflow用户

发布于 2013-12-20 14:18:02

正如您所说的,您正在寻找库/ gems,下面是一些实现字符串距离和模糊匹配的gems:

库不扩展核心类,因此无法使用==运算符对字符串进行比较,但是可以计算它们的相似性并找到类似的字符串。

对于Soundex,Metaphone和类似的,您可以使用美妙的文本宝石。它可能更多涉及使用语音算法,因为它们可能工作得更好或更糟,取决于语言。完全适用于英语的东西可能对其他语言不起作用。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/20705174

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档