首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >GIZA++:禁止零句长度0

GIZA++:禁止零句长度0
EN

Stack Overflow用户
提问于 2017-06-07 16:45:04
回答 1查看 212关注 0票数 1

当我在测试数据集上使用一个错误时,我一直在使用GIZA++来翻译句子:错误:禁止零句长度0“。有什么办法避免这个错误吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-02-23 07:53:42

我对en语料库也有同样的问题。(英语-越南语)因为你的语料库数据太长或不干净。

你应该清理你的语料库数据。

它将限制句子长度为80。这是摩西的命令。

代码语言:javascript
复制
~/mosesdecoder/scripts/training/clean-corpus-n.perl 
~/corpus/train en vi 
~/corpus/train.clean 1 80

或者你可以手动调整。

试着把每一行的长度缩短到少于100个字符或80个单词。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/44418468

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档