首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏专知

    【论文推荐】最新六篇机器翻译相关论文— 自注意力残差解码器、SGNMT、级联方法、神经序列预测、Benchmark、人类水平

    Three different GBNs, namely uniform GBN, language-model GBN and coaching GBN, are proposed to penalize

    1.2K70发布于 2018-04-08
  • 来自专栏NLP/KG

    深度学习进阶篇-国内预训练模型[5]:ERINE、ERNIE 3.0、ERNIE-的设计思路、模型结构、应用场景等详解

    BERT使用了MLM(masked language-model)和NSP(Next Sentence Prediction)两个预训练任务来进行训练,这两个任务可能并不足以让BERT学到那么多复杂的语言知识 * * *说明:masked language-model(MLM)是指在训练的时候随即从输入预料上mask掉一些单词,然后通过的上下文预测这些单词,该任务非常像我们在中学时期经常做的完形填空。

    4.5K00编辑于 2023-05-28
  • 来自专栏AI科技评论

    NLP如此钟情英语研究真的好吗?

    Classification (2018), https://www.aclweb.org/anthology/P18-1031.pdf What Kind of Language Is Hard to Language-Model

    64330发布于 2020-08-10
领券