首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何将自己的字典添加到python中的分词库中?

如何将自己的字典添加到python中的分词库中?
EN

Stack Overflow用户
提问于 2018-02-20 19:39:33
回答 2查看 479关注 0票数 1

为了在python中拆分单词,我使用了wordsegment库,它有内置的字典,根据字典进行单词的拆分。有没有人能告诉我怎么把更多的单词加到字典里?代码如下:

代码语言:javascript
复制
import wordsegment as ws
from wordsegment import load, segment
from wordsegment import segment
help(wordsegment)
load()
segment("rollersharp")
['roller', 'sharp']

该词典来自以下链接:https://github.com/grantjenks/python-wordsegment/tree/master/wordsegment

EN

回答 2

Stack Overflow用户

发布于 2018-02-20 19:45:05

自定义字典的用法在official docs中有很好的介绍。

要扩展现有语料库,需要更新wordsegment.UNIGRAMSwordsegment.BIGRAMS

票数 0
EN

Stack Overflow用户

发布于 2018-02-20 19:59:01

如果你想创建一个新的字典,请点击这个链接http://www.grantjenks.com/docs/wordsegment/using-a-different-corpus.html。如果要将单词添加到现有词典中,请使用

代码语言:javascript
复制
import wordsegment as ws
ws.bigram_counts['my text'] = 10.2e6 #basing on number of google search results returned
ws.segment('my text')

希望这能有所帮助。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/48884497

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档