更有挑战性的方面，如果你还没有弄明白的话，可能是为你的低资源语言找到一个经过预先训练的嵌入模型。给定一个小数据集，从零开始培训自己似乎是不可行的。您可能会发现一个BERT在类似语言(例如，在同一家族或语法结构中)的预培训，并根据您的数据集对最后一层进行微调。传统的BERT在英语方面受到了培训，有些BERT用其他语言进行了分离。

票数 1

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/68496

复制

相似问题

问是否有可能将伯特送至seq2seq编解码器NMT (用于低资源语言)？
EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问是否有可能将伯特送至seq2seq编解码器NMT (用于低资源语言)？EN