搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏人工智能极简应用
【AI大模型】Transformers大模型库（九）：大模型微调之计算微调参数占比
一、引言这里的Transformers指的是huggingface开发的大模型库，为huggingface上数以万计的预训练大模型提供预测、训练等服务。 Transformers 提供了便于快速下载和使用的API，让你可以把预训练模型用在给定文本、在你的数据集上微调然后通过 model hub 与社区共享。你可以直接使用一个框架训练你的模型然后用另一个加载和推理。本文重点介绍如何打印微调参数，以及微调参数占比计算。二、计算微调参数占比 2.1 概述基于LoRA进行模型微调时，需要先冻结全部参数，再指定相应的Linear层进行微调，那么如何计算全部参数，如何计算微调参数以及如何计算微调参数占全部参数的比例呢？ 2.2 模型参数结构一览这里以Qwen2为例，在微调前，对大模型结构有所认知，对于QLoRA量化微调算法来说，只微调大模型的线性层（Linear层），后面会看到在LoRAConfig中，仅指定了"q_proj
65910编辑于 2024-08-13
来自专栏AI
大模型微调
所有微调方式的设计差异，本质围绕「参数更新范围」「是否引入新增模块」「是否依赖提示特征」三个核心维度展开，也因此划分出四大主流类别，参数高效微调（PEFT）是当前AI领域的绝对主流。 -3层；微调嵌入层+顶层：针对低资源语言/领域，微调词嵌入层（适配任务专属词汇）+顶层特征层。 3. 核心特点：效果接近全量微调，是工业级大模型的主流选择，参数量仍控制在5%以内。 3.
55710编辑于 2026-02-09
来自专栏人工智能极简应用
【AI大模型】Transformers大模型库（八）：大模型微调之LoraConfig
一、引言这里的Transformers指的是huggingface开发的大模型库，为huggingface上数以万计的预训练大模型提供预测、训练等服务。 Transformers 提供了便于快速下载和使用的API，让你可以把预训练模型用在给定文本、在你的数据集上微调然后通过 model hub 与社区共享。 LoRA是一种用于微调大型语言模型的轻量级方法，它通过添加低秩矩阵到预训练模型的权重上来实现适应性调整，从而在不显著增加模型大小的情况下提升特定任务的性能。 target_modules: 指定模型中的哪些模块（层）将应用LoRA适应。这允许用户集中资源在对任务最相关的部分进行微调。 get_peft_model(model, config) print_trainable_parameters(model) 三、总结本文简要介绍LoraConfig的配置参数情况，具体的机遇peft对大模型进行微调后面单独开一页详细讲解
95110编辑于 2024-08-13
AI大模型微调企业项目实战课（完结）
AI 大模型落地核心：企业级微调实战全解析在人工智能从“技术狂欢”迈向“产业深耕”的2025年，通用大模型（Foundation Models）虽然展现了惊人的泛化能力，但在垂直领域的实际应用中，往往面临着企业级微调（Fine-tuning），正是连接通用智能与行业专有知识的桥梁，是AI大模型真正落地产生商业价值的核心引擎。一、战略定位：从“通用大脑”到“行业专家”的蜕变通用大模型如同受过通识教育的博学家，博览群书却缺乏特定领域的深度经验。结语：重塑企业智能的新范式企业级微调实战，标志着AI应用从“拿来主义”进入了“精工细作”的新时代。它不再是大厂的特权，而是每一家拥有数据资产的企业都能掌握的核心竞争力。通过高质量的数据工程、高效的参数微调技术、严格的评估对齐体系以及稳健的工程架构，企业能够将通用大模型转化为懂业务、守规矩、能进化的专属智能体。这不仅是技术的胜利，更是管理智慧与数据战略的结晶。
16610编辑于 2026-03-19
来自专栏喔家ArchiSelf
解读大模型的微调
实际上，可以使用预训练的大型语言模型进行新任务的上下文学习并进行微调。那么，什么是上下文学习？又如何对大模型进行微调呢？ 1. 上下文学习与索引自从GPT-2和GPT-3出现以来，可以发现在预训练的通用文本语料库上的生成式大型语言模型（LLM）具备了上下文学习的能力，这意味着如果我们想要执行LLM没有明确训练的特定或新任务，不需要进一步训练或微调预训练的上面的情景突出了微调的三种极端情况：基于特征，仅训练最后一层或几层，或者训练所有层。当然，根据模型和数据集的不同，在各种选项之间探索也可能是值得的。 3. ” 解读TaskMatrix.AI 深度学习架构的对比分析解读ChatGPT中的RLHF 解读Toolformer 知识图谱的5G追溯图计算的学习与思考 AI系统中的偏差与偏见面向AI 的数据生态系统机器学习与微分方程的浅析神经网络中常见的激活函数老码农眼中的大模型（LLM）《深入浅出Embedding》随笔机器学习系统架构的10个要素清单管理？
1.5K30编辑于 2023-09-02
AI大模型算法-从大模型原理剖析到训练(微调)落地实战
这些大模型不仅能够理解和生成高质量的自然语言文本，还能适应多种下游任务，极大地推动了AI技术的落地应用。然而，大模型的训练和微调涉及复杂的算法、庞大的计算资源和精细的优化策略。本文将从大模型的基本原理出发，深入剖析其核心算法，并探讨如何在实际业务中进行训练和微调，最终实现AI大模型的落地应用。2. 2.3 大模型的优化策略由于大模型的参数量巨大（如GPT-3有1750亿参数），训练过程面临计算资源、内存和优化效率的挑战。 3. 大模型的训练与微调实战3.1 数据准备大模型的训练依赖高质量数据，通常需要：大规模无监督数据（如Common Crawl、Wikipedia）用于预训练。 AI民主化：开源社区（如LLaMA、Falcon）推动大模型普及。6. 结论AI大模型正在重塑人工智能的应用范式，从原理到落地涉及算法、数据、计算资源等多方面挑战。
2.3K20编辑于 2025-07-07
AI大模型算法-从大模型原理剖析到训练(微调)落地实战
AI大模型算法：从原理剖析到训练微调落地实战全景指南我们正站在一个历史性的拐点上。以ChatGPT、GPT-4、Llama、文心一言等为代表的AI大模型，正以前所未有的力量重塑各行各业。然而，对于大多数企业和开发者而言，从头开始训练一个千亿级参数的大模型是遥不可及的。真正的价值在于——如何深入理解其原理，并掌握对现有大模型进行定制化训练（微调）的能力，让其为我所用，解决实际业务问题。一、核心概念：什么是大模型？为什么需要微调？大模型：通常指基于“Transformer”架构、在海量多源数据上训练而成的、参数规模达到数十亿乃至数千亿的深度学习模型。二、原理剖析篇：揭开大模型的神秘面纱要有效地微调模型，必须首先理解其工作原理。核心包括以下几大支柱：Transformer 架构：这是所有现代大模型的“骨架”。模型选择：从Hugging Face选择开源基础模型，如：Llama 2 / 3：Meta发布，综合能力强，开源社区的宠儿。ChatGLM3：清华大学发布，中英文双语能力优异，更适合中文场景。
92411编辑于 2025-08-28
来自专栏腾讯技术工程官方号的专栏
大模型微调方法总结
但是随着预训练语言模型越来越大，这个范式存在以下问题： ● 当我们 finetune 大模型时，由于训练成本太高，不太可能重新训练所有模型参数 ● 以前的方法（论文发表于 2021 年）都或多或少有其它性能问题假设要在下游任务微调一个预训练语言模型（如 GPT3），则需要更新预训练模型参数，公式表示如下： W0 是预训练模型初始化的参数，ΔW 就是需要更新的参数。如果是全参数微调，则它的参数量=W0 参数量（如果是 GPT3，则 ΔW≈175B）。从这可以看出要全参数微调大语言模型，小家小户是不可能的。目前该技术已经广泛应用于大模型的微调，如 Alpaca，stable diffusion+LoRA，而且能和其它参数高效微调方法有效结合，例如 State-of-the-art Parameter-Efficient 对于 BERT 类双向语言模型采用模版(P1, x, P2, [MASK], P3)，对于单向语言模型采用(P1, x, P2, [MASK])：同时加了两个改动： 1、考虑到预训练模型本身的 embedding
2.9K42编辑于 2023-07-26
来自专栏深圳架构师同盟
LoRA大模型微调介绍
一、微调流程二、选择微调基础模型如果我们需要进行的是监督指令微调，建议选择带-Instruct后缀的模型，关于模型命名及后缀说明如下截图：三、准备意图识别微调训练集和验证集提醒：从开源平台（如Hugging 然后看情况看模型效果，慢慢调高或者。特别是小数据集的朋友们，一开始不要用特别大的学习率。例如1e-4、2e-4这种的。总的来说，小一点的学习率确实比较好拟合。也有不错的效果。 3、截断长度（Cutoff length）截断长度（Max Length）决定了模型处理文本时能接收的最大 token 数量（token 是文本分块后的单元，如词语、子词）。这样就能实现用小显存实现大 batch size 的效果，类似于 “分期付款” 的效果。五、模型微调后验证通过预留的10%的微调数据集用做训练后的模型验证集。模型验证数据集中可以加上对应训练时的提示词，如：你是一个意图识别专家，可以根据用户的问题识别出意图，并返回对应的函数调用和参数。
44910编辑于 2026-01-21
来自专栏AI理论与前沿
对于大模型，到底微调还是不微调？
调整开源大语言模型（LLM）的系列博客的第二篇文章。本文讨论：“什么时候应该进行微调，什么时候应该考虑其他技术？”0 引言在 LLM 出现之前，微调通常用于小规模模型（100M – 300M 参数）。最重要的是，大型模型的微调需要更大的资源和商业硬件。下表 1 列出了在三种情况下，微调 Llama 2 7B 和 Llama 2 13B 模型的峰值 GPU 内存使用量。 QLoRA 这样的算法使得使用有限资源对大模型进行微调变得更加可行。作为示例，表 1 显示了 Llama 2 7B 的三种微调模式（全微调、LoRA 和 QLoRA）的峰值 GPU 内存。 1.4 成本节约微调可以将 Llama 2 70B/GPT-4 等大模型的技能提炼到较小的模型中，如 Llama 2 7B，从而在不影响质量的情况下降低成本和延迟。 3 总结请参考上述问题，以指导你是否需要 RAG 和/或微调，并通过内部实验来分析错误并理解可能的指标提升。最后，微调探索确实需要一个稳健的数据收集和数据改进策略，我们建议在开始微调之前进行这一步。
93100编辑于 2024-09-17
【大模型微调】一文掌握5种大模型微调的方法
一、大模型微调的基础理论在探索具体方法之前，我们首先需要建立一个清晰的认知框架，理解大模型微调在整个AI模型生命周期中所扮演的角色。大模型微调究竟是什么？直观上，大模型微调即是指通过输入特定领域或任务的数据，并有选择性地调整模型参数的技术过程。 3、QLoRA-极致压缩的微调方案QLoRA（Quantized Low-Rank Adaptation）是LoRA的“量化增强版”，通过将预训练模型量化为4位精度，进一步压低了微调的内存门槛。四、大模型微调赋能智能未来综上所述，大模型微调是连接通用基座模型强大能力与具体业务需求的关键桥梁。参数效率将进一步提升，自动化工作流将更加完善，我们期待与开发者共同推动大模型技术在更多场景的落地应用，让每个人都能轻松享受大模型定制带来的技术红利。PS.如何学习AI大模型？
3.5K40编辑于 2025-10-23
来自专栏YO大数据
【AI大模型】从零开始运用LORA微调ChatGLM3-6B大模型并私有数据训练
lfs下载 4.4 模型下载和代码拉取 4.5 依赖下载 5 模型微调 5.1 数据准备 5.2 LORA微调 5.3 微调前后对比 6 总结 1.什么是ChatGLM3-6B ChatGLM3 是智谱 AI和清华大学 KEG 实验室联合发布的对话预训练模型。 2.什么是LORA微调技术 LoRA（Low-Rank Adaptation）微调技术是一种用于微调大型预训练语言模型的方法。此外，这种方法也适用于那些需要对模型进行频繁更新的应用 3.算力平台由于模型微调需要用到大量算力，对GPU要求较高，推荐小伙伴租借算力平台的服务器进行使用本文使用的环境：Ubantu + RTX4090 ，效果并不是那么好后续将更新更多微调方式需要大模型语言包的朋友们可以看主页
3.7K02编辑于 2024-05-25
来自专栏机器学习与统计学
微调大模型，门槛低到离谱
微调大模型这件事，门槛低到什么程度了？之前这事儿都可以做成商业模式了，数据、环境、脚本、硬件一套下来，成本极高。 Unsloth 会自动安装依赖、下载模型、开始训练。你甚至不需要自己有 GPU，用 Google 的免费 T4 就能微调 8B 参数的大模型，真正的零成本入门。 Vision RL、TTS 微调视觉大模型也能用 GRPO 做强化学习了。门槛确实低到离谱总的来说：如果你一直想微调大模型、训自己的推理模型、或者只是想试试「把 Claude 的能力蒸馏到小模型里」，现在就是最好的时机。 DeepSeek V3+R1 满血微调工具一键启动，硬件要求降 10 倍大模型微调实战，教程 + 代码微调一个视觉大模型，手写数字识别为例，从零开始，基于 Qwen2.5，附代码！
72510编辑于 2026-03-02
来自专栏猿人谷
大语言模型的微调策略
本文章讲大语言模型的微调策略及基于 ChatGPT 的微调。一.大语言模型的微调策略微调是让预训练的大语言模型适应特定领域任务的关键技术。根据不同的需求和资源用户可以选择全面微调或参数高效微调。二.基于ChatGPT的微调 2023年8月 23日，OpenA宣布对GPT-3.5 开放微调 API，允许 AI开发人员通过专门的数据在专门的任务上实现更高的性能。 OpenAI 的大语言模型 ChatGPT 已经在大量文本上进行了预训练，而微调可以让其更适合特定的应用场景。 1.使用 Fine-Tuning Ul 微调 OpenAl 支持通过 Fine-Tuning UI进行大语言模型的微调。（5）作者技术实力深厚，经验提炼与代码实操双助力：作者倾力总结多年AI架构实战经验，结合真实项目中的痛点问题，提供一线开发技巧与工程化思维，帮助开发者在实践中掌握大模型开发的“术”与“道”。
62710编辑于 2025-10-21
来自专栏数据派THU
独家 | 何时微调大语言模型？
作者：Skanda VIvek翻译：陈之炎校对：zrx 本文约3100字，建议阅读7分钟对开源的大语言模型进行微调的确令人兴奋不已，相比之下，又如何微调非开源的大语言模型呢？标签：大语言模型领英（LinkedIn）账号的fork中向我提出了这样一个问题：如何微调诸如LLaMA的开源模型。这就是微调的作用所在。微调LLM 在讨论微调大语言模型之前，首先谈谈像BERT这样的小语言模型的微调，这在大语言模型出现之前很常见。要点应用于特定领域的LLM在行业中非常有价值，在增加成本和可定制性方面分为3个层面： 1. 如果具备大约~50-100k指令或对话来微调基线模型的数据库，这也值得一试。 3.
60120编辑于 2023-08-08
来自专栏大模型&AIGC
6种大模型微调技术
之后拼接query正常输入LLM，并只训练这些embedding(4) 特点效果优于GPT-3的few-shot learning当模型参数量达100亿时，接近于全模型微调效果4.P-tuning（2021 我们提出了一个新颖的实验发现：经过适当优化的提示微调可以在广泛的模型规模和NLU任务中普遍有效。它在性能上与微调相当，但仅需要调整0.1%-3%的参数。，无需verbalizer(4) 特点在小、大模型上，效果均优于P-tuning。随着我们预训练更大的模型，全面微调（即重新训练所有模型参数）变得不太可行。以GPT-3 175B为例，部署独立的微调模型实例，每个实例都有175B参数，成本是极其昂贵的。与使用Adam对GPT-3 175B进行微调相比，LoRA可以将可训练参数数量减少10,000倍，GPU内存需求减少3倍。
2.6K00编辑于 2025-05-08
来自专栏程序那些事
LoRA大模型微调的利器
LoRA（Low-Rank Adaptation）是一种微调Stable Diffusion模型的训练技术。虽然我们已经有像Dreambooth和文本反转这样的训练技术。那么LoRA有什么用呢？像文本反转一样，你不能单独使用LoRA模型。它必须与模型检查点文件一起使用。LoRA通过对配套的模型文件进行小的修改来改变风格。 LoRA是定制AI艺术模型的绝佳方式，而不会占用太多本地存储空间。 LoRA对Stable Diffusion模型中最关键的部分进行小的修改：交叉注意力层。研究人员发现，微调这部分模型就足以实现良好的训练。 LoRA模型通过将自己的权重加到这些矩阵上来微调模型。如果LoRA模型需要存储相同数量的权重，它们的文件怎么会更小呢？LoRA的技巧是将矩阵分解成两个更小的（低秩）矩阵。实用的LoRA模型这里介绍一些在实际应用中比较实用的Lora。 add_detail 谁不想要AI图像中更多的细节？细节调整器允许你增加或减少图像中的细节。现在，你可以调整你想要的细节量。
5.1K21编辑于 2024-09-04
来自专栏charlieroro
2024年大语言模型的微调
微调包括调节通用模型并将其调节为特定模型，它是连接通用预训练模型和特定应用的特定需求之间的桥梁，从而保证大语言模型能够接近人类的预期。用于微调大语言模型的数据集必须服务于指导的目的。完整微调会为每个训练的任务提供一个新版本模型，这些新模型和原始模型一样大，因此如果你需要为多个任务进行微调的话，看会导致存储成本问题。最新的AI产品Grok就使用了RAG技术来保证其信息的新鲜和时效性。 RAG优于微调的一点是信息管理。传统的微调将数据嵌入了模型架构中，基本上是"硬写入"的知识，可以防止被轻易篡改。在将微调应用到RAG系统一文中就通过将二者结合来确定和改进模型中较弱的组件。 RAG和微调的对比如下：微调最佳实践明确定义任务定义任务是微调大语言模型的基础步骤。
79210编辑于 2024-03-08
来自专栏具身小站
大模型参数高效微调概述（PEFT）
PEFT，全称是参数高效微调（Parameter-Efficient Fine-Tuning），是一套用于调整大型预训练模型（如大语言模型LLM）以适应特定下游任务的方法论，其核心思想是在极小化计算和存储资源 QLoRA ：LoRA的进化版，结合了4-bit量化技术，进一步将模型的基本权重压缩，使得在单张消费级GPU（如24GB显存）上微调650亿参数的大模型成为可能。 3 PEFT的主要作用与优势 PEFT之所以成为大模型应用的关键技术，是因为它解决了全量微调的几大痛点：极大降低硬件门槛：由于需要计算和存储梯度的参数极少，对GPU显存的需求大幅下降。 4 应用领域 PEFT的应用早已不限于大语言模型（NLP），它已扩展到AI的各个前沿领域：多模态模型：用于微调图像生成模型（如Stable Diffusion）进行风格化训练（如DreamBooth 总的来说，PEFT不是单一的算法，而是一套让大模型“飞入寻常百姓家”的方法论。
46410编辑于 2026-03-09
来自专栏创作是最好的自我投资
关于大模型微调，你了解多少
这就是大模型，比如今年火爆的DeepSeek。微调与强化学习、模型蒸馏通常情况下，大模型泛指的是通用大模型，也就是说大模型在对知识理解的广度上来说，任何领域，任何学科的知识都懂。这个时候就需要用到大模型微调了。举个例子：这里还以上面做菜的例子来说，在通过了对你的AI食谱的不断微调优化之后，那么做出来的菜是否就真的一定满足客户的口味呢。大模型微调微调不仅可以显著提高模型在特定领域或任务上的表现，还能使其适应于各种具体应用场景的需求。高效微调应用场景高效微调像是给通用AI模型穿上一件变化马甲，可以让你无需从头改造，却能瞬间适配千行百业。比如：对话风格：高效微调可以用于根据特定需求调整模型的对话风格。
67720编辑于 2025-03-27

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

【AI大模型】Transformers大模型库（九）：大模型微调之计算微调参数占比

大模型微调

【AI大模型】Transformers大模型库（八）：大模型微调之LoraConfig

AI大模型微调企业项目实战课（完结）

解读大模型的微调

AI大模型算法-从大模型原理剖析到训练(微调)落地实战

AI大模型算法-从大模型原理剖析到训练(微调)落地实战

大模型微调方法总结

LoRA大模型微调介绍

对于大模型，到底微调还是不微调？

【大模型微调】一文掌握5种大模型微调的方法

【AI大模型】从零开始运用LORA微调ChatGLM3-6B大模型并私有数据训练

微调大模型，门槛低到离谱

大语言模型的微调策略

独家 | 何时微调大语言模型？

6种大模型微调技术

LoRA大模型微调的利器

2024年大语言模型的微调

大模型参数高效微调概述（PEFT）

关于大模型微调，你了解多少

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐