首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >有没有ruby库用来检查一个字符串是否是一个有效的单词?

有没有ruby库用来检查一个字符串是否是一个有效的单词?
EN

Stack Overflow用户
提问于 2010-02-18 06:26:58
回答 3查看 1.8K关注 0票数 3

我试图隔离pdf文件中的单个单词,但是当使用pdf-reader读取该文件时,文本出现分裂,如下所示

代码语言:javascript
复制
"A lit"
"tle "
"bit of tex"
"t"

因此,我计划使用一些启发式方法将它们组合在一起。为此,我需要一个库来检查给定的字符串是否为有效的英语单词,例如

代码语言:javascript
复制
"tree".is_english? # => true
"askdjfah".is_english? # => false

这真的存在吗?理想情况下,它也适用于德语文本。

如果没有,网上有没有免费的字典?我想,如果有必要的话,我可以编写自己的树结构来执行查找。

EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2010-02-18 06:56:44

您可以使用您喜欢的任何字典查看raspell,甚至手动调用aspell

票数 3
EN

Stack Overflow用户

发布于 2010-02-18 09:13:10

如果你的系统上安装了unix工具look,你可以很容易地检查一个单词是否是一个单词。示例:

代码语言:javascript
复制
strings = %w{ cat dog tree trees treez }

strings.each do |string|
  if system("look #{string} > /dev/null 2>&1") 
    puts "#{string} is a word"
  else
    puts "#{string} is not a word"
  end
end

以下是有关look的更多信息:http://docstore.mik.ua/orelly/unix/upt/ch27_18.htm

由于look使用/usr/dict/words中的单词字典,因此我认为可以安装德语单词字典。在Debian中查找wgerman包。我不确定如何在其他系统上安装它。

票数 3
EN

Stack Overflow用户

发布于 2010-02-18 06:31:42

我不知道有哪一个图书馆能做你想要的,但是有带单词的字典。在谷歌上找到它们应该不难。例如this

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/2284884

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档