搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

【大模型微调】一文掌握5种大模型微调的方法
（Prompt Tuning）在内的5种主流方法。为什么大模型微调至关重要？微调的重要性在于它能够“激活”基座模型的潜在能力，为其“装备”上精细化、专业化的功能。没有微调，大模型就像一件未开刃的神兵，空有材质而缺乏锋芒。我们所讨论的5种微调方法，本质上都是对这个基础架构中自注意力机制与前馈神经网络等核心组件的参数进行优化的不同策略。 5、提示调整-轻量级的参数优化提示调整（Prompt Tuning）是一种“润物细无声”的微调，不改变模型自身，而是通过优化输入提示词的嵌入表示来引导模型输出。为此，我特意整理了全套《大模型微调实战进阶宝典》，这份资料凝聚了我多年的实战经验，其中包含：《大模型微调实战避坑指南》：精选20+真实项目经验，解析训练发散、灾难性遗忘等高频难题《十大前沿行业微调白皮书
3.5K40编辑于 2025-10-23
来自专栏人工智能
5 分钟搞懂 LLM 微调：从原理到实战
一、什么是微调微调（Fine-tuning）是指在一个已经预训练好的大语言模型基础上，用特定领域或任务的数据继续训练，让模型更好地适应具体需求。打个比方，预训练模型像是一个读过海量书籍的通才，而微调就是让这个通才去某个专业领域进修，变成该领域的专家。二、为什么需要微调预训练模型虽然知识面广，但在具体场景下往往不够精准。微调可以让模型学会这些特定的模式和知识，同时成本远低于从头训练一个模型。三、主流微调方法全参数微调（FullFine-tuning）：对模型所有参数进行更新。、微调vs其他技术的对比与RAG（检索增强生成）对比RAG是让模型在回答时检索外部知识库，不改变模型本身；微调是改变模型参数。与PromptEngineering对比提示工程是通过设计输入提示词来引导模型，不需要训练；微调需要训练但效果更稳定。简单任务用提示工程即可，复杂或高频任务适合微调。
31710编辑于 2026-02-12
来自专栏AI
微调
在高层次上，微调包括以下步骤：准备并上传训练数据训练一个新的微调模型评估结果，如果需要，返回到步骤 1使用您的微调模型访问我们的定价页面，了解有关微调模型训练和使用的更多信息。可以进行微调的模型有哪些？GPT-4的微调目前处于实验性访问计划中 - 符合条件的用户可以在创建新的微调任务时在微调界面上申请访问权限。 train_accuracy,valid_loss,valid_mean_token_accuracy1,1.52347,0.0,,2,0.57719,0.0,,3,3.63525,0.0,,4,1.72257,0.0,,5,1.52379,0.0 我会为您安排这次会议”（当它不应该这样做时），请查看现有示例是否教会了模型说它可以做新事情，而实际上它不能做考虑数据的平衡性和多样性如果数据中有60%的助手回复说“我无法回答这个问题”，但在推断时只有5% 我可以继续微调已经微调过的模型吗？是的，您可以在创建微调作业时将已微调模型的名称传递给模型参数。这将以已微调模型为起点开始一个新的微调作业。我如何估计微调模型的成本？请参考上文中的成本估算部分。
71010编辑于 2024-04-20
来自专栏AI工程
用mT5模型微调中文分类任务示例
用mT5模型微调中文分类任务示例 mT5模型是T5模型在多语言数据集C4上的继续训练，T5本身是比较早了，是2019年的一个模型，但是后来又有很多次不同的升级。 mT5模型论文发布自2020年10月。最开始，这些prompt就是一些特殊的句子，比如说我们给gpt3的提示是：“1+1=2；2+2=4；4+5=9；5+6=”这样的提示，让模型继续生成，希望能输出5+6的正确答案。具体实现首先使用tansformers就可以很方便的去下载和调用谷歌的T5/mT5模型安装pytorch和transformers，以及分词器（tokenizer）所需的sentencepiece , T5Tokenizer model = MT5ForConditionalGeneration.from_pretrained("google/mt5-base") tokenizer = T5Tokenizer.from_pretrained
3.3K20编辑于 2022-03-30
来自专栏NLP/KG
人工智能大语言模型微调技术：SFT 监督微调、LoRA 微调方法、P-tuning v2 微调方法、Freeze 监督微调方法
人工智能大语言模型微调技术：SFT 监督微调、LoRA 微调方法、P-tuning v2 微调方法、Freeze 监督微调方法 1.SFT 监督微调 1.1 SFT 监督微调基本概念 SFT（Supervised P-tuning v2 微调方法 3.1 P-tuning v2 微调方法的相关技术传统的微调方法需要微调整个预训练语言模型，对于大语言模型的微调需要大量的资源和时间，急需更加高效的微调方法。 4.3 Freeze 微调方法的优势大量减少了大语言模型的微调参数，是一种参数高效的微调方法；由于只需微调高层特征，加快了模型的收敛，节约了微调的时间；最大程度地保留了大语言模型预训练所学习到的语言的 5.关键知识点总结 SFT监督微调时监督微调时，学习率通常会设置得很小常见误区：1.监督微调需要大量的训练时间和数据 2.监督微调将复制源模型的所有参数至目标模型 3.监督微调只需要几十条监督数据即可微调方法在效果上可以媲美全参数微调的方式 3.P-tuning v2微调方法在自然语言理解任务上表现不佳 P-tuning v2微调方法原理方面：1.P-tuning v2微调方法在transformer
10.1K66编辑于 2023-10-11
XTuner 微调
快速开始这里我们用 internlm2_5-20b-chat 模型，通过 QLoRA 的方式来微调一个自己的小助手认知作为案例来进行演示。 xtuner train 命令用于启动模型微调进程。该命令需要一个参数：CONFIG 用于指定微调配置文件。对于全量微调的模型（full）其实是不需要进行整合这一步的，因为全量微调修改的是原模型的权重而非微调一个新的 Adapter ，因此是不需要进行模型整合的。增量预训练微调定义一些基本方法。在 PART 2 的部分，由于我们复制的配置文件是全参数微调的配置，而我们希望使用 QLoRA 算法进行微调，所以可以添加 QLoRA 算法的配置。
47810编辑于 2024-10-10
来自专栏all web technology
H5行业介绍
H5是中国人制造的一个专有名词，就像有人喜欢把iPhone7，说成是“肾7”一样。虽然H5看上去像是个Html5的英文缩写，但实际上它并不单指html5。 HTML5其实也不是一项技术，而是一个标准。我曾经去面试的时候，面试的公司要求是会h5，上来就问我会h5吗？总的来说呢，H5和HTML5不是一个东西。而全栈，既包括前端也包括后端。全栈>WEB前端 >H5 那H5具体能做什么呢？在未来的5到10年，H5将是一个发展前景非常好的行业，移动互联网将会彻底的取代传统的PC网络，那么小程序的兴起对我们而言意味着什么呢，在未来的十年，我们的手机上可能再也不需要安装APP，只要我们的手机上有微信 H5的技术，也就是说H5涵盖了几乎所有的互联网技术领域，以上就是关于H5行业的介绍。
1.3K60发布于 2020-06-30
来自专栏AI理论与前沿
对于大模型，到底微调还是不微调？
QLoRA 这样的算法使得使用有限资源对大模型进行微调变得更加可行。作为示例，表 1 显示了 Llama 2 7B 的三种微调模式（全微调、LoRA 和 QLoRA）的峰值 GPU 内存。我们提供三个示例：微调 LLM 以更好地使用或忽略来自检索器的上下文微调 LLM 评审模型来评估其他 LLM 的指标，如扎根性、合规性或有用性微调 LLM 来增加上下文窗口2 微调与其他领域适应技术的比较 2.1 微调 vs. 这种担忧在微调时也存在。 2.2 微调 V.S RAG共识是，当 LLM 的基础性能不令人满意时，你可以“从 RAG 开始，评估其性能，如果不够理想，再转向微调”，或者“RAG 可能比微调更有优势” (来源)。
93000编辑于 2024-09-17
来自专栏对白的算法屋
当我在微调的时候我在微调什么？
微调效果到底好不好，微调之后的词向量表示是否有效，可以直接用针对下游任务的分类器的准确度来衡量。只有微调效果足够好时，分类效果才够准。 DIRECTPROBE 基于聚类的探针。通过比较微调前后不同簇之间的距离，可以量化微调之后的词向量表示的变化。除了BERT base版训练5个epochs之外，其余规模的BERT均训练10个epochs。分类器探针接到BERT输出层，跟着BERT一起微调。使用原始train对BERT~small~进行微调，微调前后均只使用subtrain训练分类器。分类器的训练不参与微调。如下图所示，微调前分类器在subtest和test上的学习曲线一致。随着层数的增加，不同簇之间的距离也随之增大，即微调时高层在表示空间上的变化比下层的更大。下图横轴为微调过程中梯度更新的次数，纵轴为微调前后表示空间的相似度。
2.1K10编辑于 2022-04-01
行业微调破局之道：用数据清洗与知识增强驯服大模型“幻觉”
本文以开源项目Chinese-LLaMA-Alpaca为例，系统解析如何通过可信度标记语料库、动态知识增强架构和渐进式微调策略，构建高精度行业大模型。文章包含5类核心代码实现、3种典型应用场景及配套解决方案，为开发者提供可落地的技术路径。背景：垂直领域大模型的三大痛点在GIS遥感分析等专业场景中，大模型面临特殊挑战：数据荒漠化：公开语料中专业术语占比不足0.3%（如遥感影像元数据标注）知识时效性陷阱：行业标准每年迭代超20%（如2024 渐进式微调框架# 分阶段训练策略trainer = Trainer( model=model, train_dataset=stage1_dataset, # 通用领域数据 eval_dataset 的坐标偏移幻觉总结与展望通过Chinese-LLaMA-Alpaca项目的实践验证，我们构建了三重体系：技术层幻觉抑制率数据利用率语料可信度分级34%↑节约67%标注成本动态知识增强51%↑知识更新延迟＜1h渐进式微调
71210编辑于 2025-03-06
来自专栏物联网卡和普通流量卡的区别
5Ｇ行业物联网卡
物联网卡是由三大运营商针对行业设备提供网络连接服务的一种3g/4g/5g流量卡，目前根据运营商可分为移动物联网卡、联通物联网卡、电信物联网卡。　5G物联网卡应用场景有哪些?　　 1.车联网/智能驾驶 5G增强了移动带宽,针对自动驾驶来说意味着提高更高的安全性指数,毕竟毫秒级的延时对于一场事故的发现和处理是有截然不同的意义的。　　 4.VR/AR5G通过云游戏技术提升画质，同时帮助云游戏技术降低其“网络时延”，使得采用云游戏技术方案的VR/AR产品更加流畅清晰。　　 5.无人机相关应用无人设备将得到更广泛的应用，比如警用无人机进行巡防，物流无人机对快递进行分拣或者配送，服务行业的无人机也可应用于酒店、银行等领域为客户服务。物联网的应用不仅仅在这几个方面，随着5G物联网卡的出现与应用，物联网应用将呈现井喷式发展。
82340编辑于 2022-11-18
来自专栏NLP/KG
人工智能大语言模型微调技术：SFT 监督微调、LoRA 微调方法、P-tuning v2 微调方法、Freeze 监督微调方法
人工智能大语言模型微调技术：SFT 监督微调、LoRA 微调方法、P-tuning v2 微调方法、Freeze 监督微调方法 1.SFT 监督微调 1.1 SFT 监督微调基本概念 SFT（Supervised P-tuning v2 微调方法 3.1 P-tuning v2 微调方法的相关技术传统的微调方法需要微调整个预训练语言模型，对于大语言模型的微调需要大量的资源和时间，急需更加高效的微调方法。 3.2 P-tuning v2 微调方法的原理 P-tuning v2 微调方法是 P-tuning v1 微调方法的改进版，同时借鉴了 prefix-tuning 微调的方法。 4.3 Freeze 微调方法的优势大量减少了大语言模型的微调参数，是一种参数高效的微调方法；由于只需微调高层特征，加快了模型的收敛，节约了微调的时间；最大程度地保留了大语言模型预训练所学习到的语言的 5.关键知识点总结 SFT监督微调时监督微调时，学习率通常会设置得很小常见误区：1.监督微调需要大量的训练时间和数据 2.监督微调将复制源模型的所有参数至目标模型 3.监督微调只需要几十条监督数据即可
25.6K07编辑于 2023-07-16
来自专栏蓝天
Ubuntu系统微调
参阅 syslogd(8) 和 syslog.conf(5)。硬件存取优化有一部分硬件优化的配置工作 Ubuntu 留给了系统管理员。 hdparm 硬盘存取优化。效果显著。危险。参阅 fstab(5) 和 mount(8)。通过 proc 文件系统，Linux 内核可直接调节某些硬件参数。参阅通过 proc 文件系统调整内核, 第 7.3 节。更多信息参阅 inetd(8)、inetd.conf(5)、protocols(5)、services(5)、tcpd(8)、hosts_access(5) 和 hosts_options(5)。
1.1K30发布于 2018-08-07
来自专栏AI
大模型微调
，仅优化这些新增的少量参数（通常占主模型的0.1%-5%），实现任务适配，是当前大模型（十亿/百亿/千亿参数量）、低资源任务、多任务适配的主流方式，也是LoRA所属的类别。核心特点：效果接近全量微调，是工业级大模型的主流选择，参数量仍控制在5%以内。 PEFT整体核心特点优点：参数更新比例0.1%-5%，算力/数据需求降至最低（千/万级样本即可）、无过拟合风险、多任务适配成本极低（一个主模型+多个PEFT小模块，切换任务仅替换模块）；缺点：单一任务效果略逊于全量微调早期Transformer小模型适配参数高效微调（PEFT） 0.1%-5% 极低千/万级以上基本无（LoRA）/轻微（Adapter） LoRA/Adapter/IA³ 自注意力的Q/K/V投影矩阵，与你论文的核心技术高度契合；次选LoRA+Adapter混合：若追求更高的任务适配效果，可在LoRA微调QKV的基础上，在MLP层插入轻量Adapter，参数量仍控制在5%
55210编辑于 2026-02-09
来自专栏Java学习网
大数据行业5个职位方向指南
那么在大数据行业，都有什么职位可以选择呢？来看看大数据行业的5个职位方向指南吧！　　ETL研发　　随着数据种类的不断增加，企业对数据整合专业人才的需求越来越旺盛。目前，ETL行业相对成熟，相关岗位的工作生命周期比较长，通常由内部员工和外包合同商之间通力完成。当然，除了上面五个方向，还有很多大数据行业的好职位，对大数据感兴趣的小伙伴们，赶快投入大数据的怀抱吧！
1.1K50发布于 2018-02-28
一文读懂如何用LoRA高效微调打造专属行业大模型
一文读懂如何用LoRA高效微调打造专属行业大模型摘要：本文深度解析LoRA微调技术如何以10%训练成本实现行业大模型定制化，通过HuggingFace+魔搭社区实战案例，对比全参数微调与LoRA在医疗、你将获得：1）LoRA数学原理图解2）Qwen-7B模型微调完整代码3）行业知识注入技巧4）模型蒸馏部署方案。实测显示，经LoRA优化的行业模型在专业任务中准确率提升37%，推理速度提高5倍引言：为什么需要专属行业模型？ :5max_seq_length:1024optimizer:adamw_torchlr_scheduler:cosine展开代码语言：TXTAI代码解释graphTDA[行业原始数据]-->B[指令化重构附录：完整代码包结构展开代码语言：TXTAI代码解释├──lora_config.yaml#微调参数模板├──data_builder.py#行业数据处理器├──train_peft.py#训练脚本└─
16410编辑于 2026-02-11
来自专栏云计算D1net
边缘计算的5个最佳行业应用
行业专家分享了边缘计算应用的一些常见示例——从预测设备故障到改善远程工作。 5个边缘计算示例行业专家对于企业如何投资边缘计算用例进行了分析和阐述。 (1)预测性维护 Joshi表示，围绕预测性维护的用例已经得到了发展。边缘计算解决方案在那些高价值资产下跌时会造成巨大损失的行业尤其受欢迎。在全球石油和天然气行业应用中，其管道的数字化和边缘数据和分析专业知识可以使企业积极管理和维护其管道，解决缺陷并防止故障。在该行业中，与石油和天然气相关的管道故障可能会带来巨大的财务和环境成本。长期腐蚀通常是环境造成的问题。 (5)医疗创新在发生疫情之前，医疗保健行业已经开始增加对边缘计算的投资，但是疫情迅速加速了向远程医疗技术和设备的投资。许多医疗保健问题与边缘计算减少应用程序延迟的能力相匹配。
85920发布于 2021-03-26
来自专栏猴子数据分析
游戏行业实战案例5：玩家在线分布
【区分在线时间段：0-30min，30min-1h，1-2h，2-3h，3-5h，5h以上；区间为左闭右开】）问题5：统计在开服首日各玩家在线时长分布，其中区分在线时间段：0-30min，30min -1h，1-2h，2-3h，3-5h，5h以上，区间为左闭右开，解释为大白话即为：统计2022-08-13，在线时间段在0-30min、30min-1h、1-2h、2-3h、3-5h、5h以上的玩家各有多少人将其应用在本问题中，则为： order by field(在线时间段,'0-30min','30min-1h','1-2h','2-3h','3-5h','5h以上') asc 即：将在线时间段这一列的值按照 '0-30min','30min-1h','1-2h','2-3h','3-5h','5h以上'的顺序升序排列。 (在线时间段,'0-30min','30min-1h','1-2h','2-3h','3-5h','5h以上') asc; 查询结果如下：【本题考点】 1、考察逻辑分析能力，即：如何将复杂问题拆解成容易解决的一个个子问题的能力
91430编辑于 2022-05-19
来自专栏点滴科技资讯
德勤 5G重塑行业应用
3.1K20发布于 2019-04-30
来自专栏AI技术探索和应用
ChatGLM模型微调
ChatGLM3: https://github.com/THUDM/ChatGLM3微调前建议将模型下载到本地。微调前还需要安装依赖。全量微调时，. （5）部分微调结果，其中最后的输出中展示了模型的输出目录：Model weights saved in output/tool_alpaca_pt-20240118-203444-128-2e-2/pytorch_model.bin Special tokens file saved in output/tool_alpaca_pt-20240118-203444-128-2e-2/special_tokens_map.json（5）训练精度强烈推荐使用 bf16 格式进行微调，并确认所有依赖和硬件满足微调硬件要求，否则可能出现 loss = 0 的情况。（5）部署和推断测试同Chat微调模型
1.7K21编辑于 2025-09-26

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

【大模型微调】一文掌握5种大模型微调的方法

5 分钟搞懂 LLM 微调：从原理到实战

微调

用mT5模型微调中文分类任务示例

人工智能大语言模型微调技术：SFT 监督微调、LoRA 微调方法、P-tuning v2 微调方法、Freeze 监督微调方法

XTuner 微调

H5行业介绍

对于大模型，到底微调还是不微调？

当我在微调的时候我在微调什么？

行业微调破局之道：用数据清洗与知识增强驯服大模型“幻觉”

5Ｇ行业物联网卡

人工智能大语言模型微调技术：SFT 监督微调、LoRA 微调方法、P-tuning v2 微调方法、Freeze 监督微调方法

Ubuntu系统微调

大模型微调

大数据行业5个职位方向指南

一文读懂如何用LoRA高效微调打造专属行业大模型

边缘计算的5个最佳行业应用

游戏行业实战案例5：玩家在线分布

德勤 5G重塑行业应用

ChatGLM模型微调

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐