首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用SRILM创建僧伽罗语语言模型的问题

使用SRILM创建僧伽罗语语言模型的问题
EN

Stack Overflow用户
提问于 2015-07-23 17:01:11
回答 1查看 84关注 0票数 1

我正在尝试用口袋狮身人面像创建一个僧伽罗语语音识别系统。我使用SRILM工具来创建语言模型。我用来创建语言模型的源文件是Here。我在windows 8.1上使用cygwin来运行SRILM 1.7.1。但是一旦我运行了这个命令

代码语言:javascript
复制
ngram-count -vocab sinhalalexicon.txt -text sinhalacorpus.Train -order 3     -write sinhala.count -unk

我得到了

代码语言:javascript
复制
iconv: Invalid or incomplete multibyte or wide character
iconv: Invalid or incomplete multibyte or wide character

我在这里做错了什么?使用Notepad++手动创建了sinhalacorpus.Train文件

EN

回答 1

Stack Overflow用户

发布于 2015-07-23 17:58:21

我找到了我的问题的解决方案。一旦我将语料库和词典文件转换为BOM Unix格式的,并将编码更改为UTF-8,而不使用,它就可以工作了。我使用Notepad++进行更改。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/31582725

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档