首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何在更多的数据上训练LM?

如何在更多的数据上训练LM?
EN

Stack Overflow用户
提问于 2019-07-19 16:03:56
回答 1查看 173关注 0票数 0

我希望用returnn来训练一个新的lm来获得更多的数据。但是我不知道tain和dev的确切形式。

代码语言:javascript
复制
/work/asr3/irie/data/librispeech/lm_bpe/librispeech-lm-norm.bpe.txt.gz

其次,我想知道为什么train_num_seqs等于40418260,而librispeech训练数据集只有281241语句。等待你的回复

EN

回答 1

Stack Overflow用户

发布于 2019-07-19 19:59:22

您可以下载LM模型here

LM列车数据可从official page下载。它可能需要一些后处理来准备文件librispeech-lm-nor.bpe.txt.gz,但这应该很简单。

cf函数使用some tool of us,但您可以忽略它。去掉它就行了。

另外,请参阅您在here上发布的GitHub问题中的讨论。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/57108103

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档