我正在尝试指定要使用的语言。在下面的示例中,我定义了荷兰语和法语。根据langid文档,它应该将注释归类为这两种语言中的一种,但实际上它给我的结果是英语。我不确定是否正确使用了set_languages函数。我做错了什么?
from langid.langid import LanguageIdentifier, model, set_languages
comment = 'I am trying to test the set_languages function in the langid package'
set_languages(langs=['nl','fr'])
language_identifier = LanguageIdentifier.from_modelstring(model, norm_probs=True)
lang_id = language_identifier.classify(comment)这将返回:
('en', 1.0)发布于 2020-04-11 22:55:14
稍微晚了一点,但我遇到了同样的问题,查看langid源代码,似乎全局set_languages函数只影响LanguageIdentifier的全局实例(在langid.py中),因此为自己的实例设置语言的正确方法是在其上调用set_languages方法,即
language_identifier.set_languages(langs=['nl','fr'])在上面的例子中。
https://stackoverflow.com/questions/54863086
复制相似问题