首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏机器学习算法与Python学习

    干货 | 自然语言处理(5)之英文文本挖掘预处理流程

    拼写检查,我们一般用pyenchant类库完成。pyenchant的安装很简单:"pip install pyenchant"即可。 当然,我们也可以用pyenchant中的wxSpellCheckerDialog类来用对话框的形式来交互决定是忽略,改正还是全部改正文本中的错误拼写。 大家感兴趣的话可以去研究pyenchant的官方文档。

    3.9K120发布于 2018-04-18
  • 来自专栏机器学习算法原理与实践

    英文文本挖掘预处理流程总结

    拼写检查,我们一般用pyenchant类库完成。pyenchant的安装很简单:"pip install pyenchant"即可。      当然,我们也可以用pyenchant中的wxSpellCheckerDialog类来用对话框的形式来交互决定是忽略,改正还是全部改正文本中的错误拼写。 大家感兴趣的话可以去研究pyenchant的官方文档。 5.  

    1.4K20发布于 2018-08-07
  • 来自专栏PPV课数据科学社区

    用 Python 做文本挖掘的流程

    pyenchant 可以帮你!(中文就没有这么些破事!) POS Tagging。nltk 是不二选择,还可以使用 pattern。 去掉标点符号。使用正则表达式就可以。 去掉长度过小的单词。

    2K80发布于 2018-04-23
  • 来自专栏Python数据分析实例

    使用click创建完美的Python命令行程序

    这可以使用 PyEnchant 模块实现: import click import enchant from caesar_encryption import encrypt @click.command

    1.5K10编辑于 2022-11-07
  • 来自专栏深度学习自然语言处理

    每日论文速递 | NAACL'24:自生成翻译记忆缓解翻译持续学习遗忘问题

    过滤(Filtering):对生成的伪句子进行过滤,移除重复的句子,并使用拼写检查器(如PyEnchant)来过滤掉形态不正确的句子,以保证生成样本的质量。

    41810编辑于 2024-04-11
领券