首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >SFT 监督微调基本概念

SFT 监督微调基本概念

原创
作者头像
lpp31
修改2025-10-13 16:36:18
修改2025-10-13 16:36:18
2160
举报
文章被收录于专栏:111222444111222444

1.SFT 监督微调

1.1 SFT 监督微调基本概念

SFT(Supervised Fine-Tuning)监督微调是指在源数据集上预训练一个神经网络模型,即源模型。然后创建一个新的神经网络模型,即目标模型。目标模型复制了源模型上除了输出层外的所有模型设计及其参数。这些模型参数包含了源数据集上学习到的知识,且这些知识同样适用于目标数据集。源模型的输出层与源数据集的标签紧密相关,因此在目标模型中不予采用。微调时,为目标模型添加一个输出大小为目标数据集类别个数的输出层,并随机初始化该层的模型参数。在目标数据集上训练目标模型时,将从头训练到输出层,其余层的参数都基于源模型的参数微调得到。

1.2 监督微调的步骤

具体来说,监督式微调包括以下几个步骤:

  • 预训练: 首先在一个大规模的数据集上训练一个深度学习模型,例如使用自监督学习或者无监督学习算法进行预训练;
  • 微调: 使用目标任务的训练集对预训练模型进行微调。通常,只有预训练模型中的一部分层被微调,例如只微调模型的最后几层或者某些中间层。在微调过程中,通过反向传播算法对模型进行优化,使得模型在目标任务上表现更好;
  • 评估: 使用目标任务的测试集对微调后的模型进行评估,得到模型在目标任务上的性能指标。

1.3 监督微调的特点

点石业务分享.pptx

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1.SFT 监督微调
    • 1.1 SFT 监督微调基本概念
    • 1.2 监督微调的步骤
    • 1.3 监督微调的特点
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档