首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >hunspell_spell的含义是什么?

hunspell_spell的含义是什么?
EN

Stack Overflow用户
提问于 2020-08-04 23:02:41
回答 1查看 37关注 0票数 0

我正在做文本分类工作,遇到了拼写错误的问题。我试图用spacy_hunspell来解决这个问题,但是我不能理解hunspell_spell属性的意义,因为它总是返回None。

代码语言:javascript
复制
for token in  nlp('I can haz cheezeburger.'):
    print(token._.hunspell_spell)
    if not token._.hunspell_spell:
        print(token.text, token._.hunspell_suggest)

上面列出的代码返回:

代码语言:javascript
复制
None
I ['I', 'Ia', 'In', 'Ir', 'It', 'Io', 'IE', 'IA', 'AI', 'IN', 'RI', 'IT', 'IL', 'ID', 'DI']
None
can ['Can', 'van', 'cab', 'cam', 'ca', 'an', 'cane', 'cans', 'scan', 'cant', 'clan', 'cyan', 'Scan', 'car', 'ran']
None
haz ['ha', 'haze', 'hazy', 'has', 'hat', 'had', 'hag', 'ham', 'hap', 'hay', 'haw', 'ha z']
None
cheezeburger ['cheeseburger', 'vegeburger']
None
. []

一开始,我认为这个属性返回的token是否拼写错误。

有人知道property hunspell_spell是什么意思吗?

如何用spacy_hunspell检查单词拼写错误(不符合词法规则)?

我认为我的实现并不理想。

代码语言:javascript
复制
for token in  nlp('I can haz cheezeburger.'):
    is_correct = any([token.text == str.lower(suggest) for suggest in token._.hunspell_suggest])
    is_correct = "correct" if is_correct else "misspeled"
    print(f"{token.text} is {is_correct}")

上面列出的代码返回:

代码语言:javascript
复制
I is misspeled
can is correct
haz is misspeled
cheezeburger is misspeled
. is misspeled
EN

回答 1

Stack Overflow用户

发布于 2020-08-04 23:05:20

它是一个免费的拼写检查器、形态分析库和命令行工具

票数 -1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/63249682

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档