首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何使用inltk标记indic语言

如何使用inltk标记indic语言
EN

Stack Overflow用户
提问于 2022-02-24 12:00:21
回答 1查看 205关注 0票数 0

我使用这个NLP文档进行了检查:https://inltk.readthedocs.io/en/latest/index.html

代码语言:javascript
复制
from inltk.inltk import tokenize 
text="जो मुझको सताती है तुझे वो बातें आती है जब सामने तू होता नहीं बेचैनी बढ़ जाती है मैं रूठ "
tokenize(text ,'hi')

错误是:

代码语言:javascript
复制
RuntimeError: Internal: src/sentencepiece_processor.cc(890)
[model_proto->ParseFromArray(serialized.data(), serialized.size())] 
EN

回答 1

Stack Overflow用户

发布于 2022-02-24 21:55:19

当使用错误的SPM模型或与SPM模型相关的任何其他问题时,通常会出现您遇到的问题。

确保首先设置语言支持:

代码语言:javascript
复制
from inltk.inltk import setup
setup('hi')
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/71251625

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档