首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何通过langid LanguageIdentifier使用set_languages

如何通过langid LanguageIdentifier使用set_languages
EN

Stack Overflow用户
提问于 2019-02-25 17:31:07
回答 1查看 253关注 0票数 1

我正在尝试指定要使用的语言。在下面的示例中,我定义了荷兰语和法语。根据langid文档,它应该将注释归类为这两种语言中的一种,但实际上它给我的结果是英语。我不确定是否正确使用了set_languages函数。我做错了什么?

代码语言:javascript
复制
from langid.langid import LanguageIdentifier, model, set_languages


comment = 'I am trying to test the set_languages function in the langid package'
set_languages(langs=['nl','fr'])
language_identifier = LanguageIdentifier.from_modelstring(model, norm_probs=True)
lang_id = language_identifier.classify(comment)

这将返回:

代码语言:javascript
复制
('en', 1.0)
EN

回答 1

Stack Overflow用户

发布于 2020-04-11 22:55:14

稍微晚了一点,但我遇到了同样的问题,查看langid源代码,似乎全局set_languages函数只影响LanguageIdentifier的全局实例(在langid.py中),因此为自己的实例设置语言的正确方法是在其上调用set_languages方法,即

代码语言:javascript
复制
language_identifier.set_languages(langs=['nl','fr'])

在上面的例子中。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/54863086

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档