搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏DeepHub IMBA
4张图片就可以微调扩散模型
稳定扩散模型因其从文本描述生成高质量、多样化图像的能力而获得了极大的关注。但是这些预训练模型在生成高度定制或个性化主题的图像时可能会有所不足。这时就需要我们进行手动的微调。微调可以根据相对较小的图像集向模型教授新的、独特的主题。我们今天使用DreamBooth在不影响模型原始功能的情况下实现微调过程。 2、生成模型的微调微调是指在一个新的、通常更小的数据集上调整预训练的模型，以使模型适应特定的需求，而不会失去从原始数据集学习到的泛化性。这种方法在数据稀缺或需要定制的应用程序中至关重要。在数学上，微调调整模型的参数θ以优化新数据集Dnew上的损失函数L，同时防止与原始参数θ origin的显著偏差。传统的微调可能会导致过度拟合或灾难性遗忘(忘记原始数据分布)，DreamBooth则能确保模型保留其一般功能。该过程包括训练特定于主题的标记以及原始模型参数。
87610编辑于 2024-02-21
来自专栏AI
大模型微调
# 大模型微调的主流方式、核心区别与底层原理微调（Fine-tuning）的核心底层共性：基于预训练模型的知识迁移，冻结预训练模型的大部分通用特征参数，仅针对具体任务优化少量参数/引入轻量模块/设计提示特征二、第二类：部分微调（Partial Fine-tuning）底层核心原理基于预训练模型的特征分层特性，冻结模型底层/中层的通用特征参数，仅微调上层的任务特定特征参数，是全量微调的轻量化改进版。核心设计逻辑 Transformer类预训练模型的底层层（如前3-4层）学习的是通用语言特征（如词性、句法、基础语义），所有任务通用；上层层（如后3-4层）学习的是抽象任务特征（如语义匹配、领域专属表达 4. 以内，适合工业级两段式端到端模型的落地；避免全量/部分微调：针对Transformer大模型的两段式端到端架构，全量/部分微调的算力成本极高，且多任务适配时模型存储成本不可接受。
55410编辑于 2026-02-09
来自专栏AI技术探索和应用
ChatGLM模型微调
ChatGLM3: https://github.com/THUDM/ChatGLM3微调前建议将模型下载到本地。微调前还需要安装依赖。 conda create -n chatglm3 python=3.11 -ypip install astunparse对话模型微调我们使用 ToolAlpaca 数据集来进行微调。这种方法在微调的step较多的情况下会影响到模型的工具调用功能。 /scripts/finetune_pt_multiturn.sh # P-Tuning v2 微调（4）微调参数调整参考显存用量P-Tuning V2 PRE_SEQ_LEN=128, DEV_BATCH_SIZE 训练精度强烈推荐使用 bf16 格式进行微调，并确认所有依赖和硬件满足微调硬件要求，否则可能出现 loss = 0 的情况。（5）部署和推断测试同Chat微调模型
1.7K21编辑于 2025-09-26
来自专栏相约机器人
PyTorch模型微调实例
__version__ Out[1]: '1.0.0' Fine tuning 模型微调在前面的介绍卷积神经网络的时候，说到过PyTorch已经为我们训练好了一些经典的网络模型，那么这些预训练好的模型是用来做什么的呢没关系，我们先找到一个同类的别人训练好的模型，把别人现成的训练好了的模型拿过来，换成自己的数据，调整一下参数，再训练一遍，这就是微调（fine-tune）。 PyTorch里面提供的经典的网络模型都是官方通过Imagenet的数据集与训练好的数据，如果我们的数据训练数据不够，这些数据是可以作为基础模型来使用的。为什么要微调 1. 这时候如果还想用上大型神经网络的超强特征提取能力，只能靠微调已经训练好的模型。 2. 新数据集比较小和原始数据集合差异性比较大，如果上面方法还是不行的化那么最好是重新训练，只将预训练的模型作为一个新模型初始化的数据 4.
2K10发布于 2020-02-19
GLM4大模型微调入门实战（完整代码）
GLM4是清华智谱团队最近开源的大语言模型。以GLM4作为基座大模型，通过指令微调的方式做高精度文本分类，是学习LLM微调的入门任务。显存要求相对较高，需要40GB左右。在本文中，我们会使用 GLM4-9b-Chat 模型在复旦中文新闻数据集上做指令微调训练，同时使用SwanLab监控训练过程、评估模型效果。大模型指令微调（Instruction Tuning）是一种针对大型预训练语言模型的微调技术，其核心目的是增强模型理解和执行特定指令的能力，使模型能够根据用户提供的自然语言指令准确、恰当地生成相应的输出或执行相关任务指令微调特别关注于提升模型在遵循指令方面的一致性和准确性，从而拓宽模型在各种应用场景中的泛化能力和实用性。 fintune", experiment_name="GLM4-9B-Chat", description="使用智谱GLM4-9B-Chat模型在zh_cls_fudan-news数据集上微调
2.6K10编辑于 2024-06-20
来自专栏AI理论与前沿
对于大模型，到底微调还是不微调？
调整开源大语言模型（LLM）的系列博客的第二篇文章。本文讨论：“什么时候应该进行微调，什么时候应该考虑其他技术？”0 引言在 LLM 出现之前，微调通常用于小规模模型（100M – 300M 参数）。最重要的是，大型模型的微调需要更大的资源和商业硬件。下表 1 列出了在三种情况下，微调 Llama 2 7B 和 Llama 2 13B 模型的峰值 GPU 内存使用量。 QLoRA 使用了 4-bit NormalFloat 量化。1 适合微调的场景类型1.1 语气、风格和格式定制某些用例可能需要 LLM 反映特定的个性或为特定的受众服务。 1.4 成本节约微调可以将 Llama 2 70B/GPT-4 等大模型的技能提炼到较小的模型中，如 Llama 2 7B，从而在不影响质量的情况下降低成本和延迟。例如，这篇文章展示了如何通过微调 GPT-3.5 评审模型，将其从更昂贵的 GPT-4 模型中提炼出来，最终节省了成本。1.5 新任务/能力通过微调，往往可以实现新的能力。
93100编辑于 2024-09-17
来自专栏喔家ArchiSelf
解读大模型的微调
实际上，可以使用预训练的大型语言模型进行新任务的上下文学习并进行微调。那么，什么是上下文学习？又如何对大模型进行微调呢？ 1. 参数高效微调参数高效微调允许我们在最小化计算和资源占用的同时重复使用预训练模型。如前所述，微调更多的层通常会导致更好的结果。如果想要微调更大的模型，例如重新生成的LLM，这些模型只能勉强适合GPU内存，该怎么办呢？人们开发了几种技术，只需训练少量参数便可通过微调提升LLM的性能。在huggingface提供的PEFT工具中，可以很方便地实现将普通的HF模型变成用于支持轻量级微调的模型，使用非常便捷，目前支持4种策略，分别是： LoRA Prefix Tuning P-Tuning 4.RHLF 在人类反馈增强学习中，预训练模型使用监督学习和强化学习相结合进行微调。这种方法是由原始的ChatGPT模型推广而来，而该模型又基于InstructGPT。
1.5K30编辑于 2023-09-02
来自专栏程序随笔
聊聊GLM-4-9B开源模型的微调loss计算
概述 Github官方地址：GLM-4 网上已经有很多关于微调的文章，介绍各种方式下的使用，这里不会赘述。我个人比较关心的是微调时的loss计算逻辑，这点在很多的文章都不会有相关的描述，因为大多数人都是关心如何使用之类的应用层，而不是其具体的底层逻辑，当然咱也说不清太底层的计算。微调微调格式： [ { "messages": [ { "role": "system", "content": "<system prompt { "role": "assistant", "content": "<assistant response text>" } ] } ] 微调源码地址
48410编辑于 2024-06-13
来自专栏Datawhale专栏
Datawhale出品：《GLM-4 大模型部署微调教程》发布！
Datawhale成员万字测评（二）教程介绍秉承开源贡献的宗旨，Datawhale团队成员在模型发布 12 小时之内，为编写了GLM-4整套教学流程，包括：模型 api 部署； Langchain ~ LoRA 高效指令微调首先通过分析子词嵌入模板，从而构造指令微调数据。进而通过对模型层级分析，判断高阶矩阵位置，从而使用 PEFT 工具对低秩转换层进行指定，开启 LoRA 微调。项目介绍《开源大模型食用指南》是一个围绕开源大模型、针对国内初学者、基于 AutoDL 平台的中国宝宝专属大模型教程，针对各类开源大模型提供包括环境配置、本地部署、高效微调等技能在内的全流程指导，简化开源大模型的部署除 GLM4 外，项目已支持 LLama3, InternLM, Qwen1.5 等 20 项开源模型全流程教程，并且，本项目代码全部开源！！
1.8K20编辑于 2024-06-08
来自专栏AI
迁移学习与模型微调
迁移学习与模型微调：如何利用已有的预训练模型1. 预训练模型与微调预训练模型（Pretrained Models）指的是已经在一个大规模数据集（例如ImageNet、COCO等）上进行过训练的模型。微调通常包括两种方法：微调部分网络层：在这种方法中，我们保留预训练模型的大部分结构，只对模型的后几层进行重新训练，以适应目标任务的特定需求。 4. 迁移学习的实际应用与案例4.1 图像识别与分类图像识别是迁移学习最常见的应用之一，尤其是在处理大规模图像数据集时。此时，研究人员可以利用在大规模图像数据集（如ImageNet）上训练的预训练模型，并通过微调来适应新的任务，例如通过微调ResNet模型来识别特定疾病的图像特征，如乳腺癌的X光片。
92800编辑于 2025-01-27
来自专栏腾讯技术工程官方号的专栏
大模型微调方法总结
假设要在下游任务微调一个预训练语言模型（如 GPT3），则需要更新预训练模型参数，公式表示如下： W0 是预训练模型初始化的参数，ΔW 就是需要更新的参数。如果是全参数微调，则它的参数量=W0 参数量（如果是 GPT3，则 ΔW≈175B）。从这可以看出要全参数微调大语言模型，小家小户是不可能的。通过添加 Adapter 模块来产生一个易于扩展的下游模型，每当出现新的下游任务，通过添加 Adapter 模块来避免全模型微调与灾难性遗忘的问题。 Adapter 方法不需要微调预训练模型的全部参数，通过引入少量针对特定任务的参数，来存储有关该任务的知识，降低对模型微调的算力要求。 4、P-tuning paper:[2103.10385\] GPT Understands, Too[2] code:[GitHub - THUDM/P-tuning: A novel method
2.9K42编辑于 2023-07-26
来自专栏DrugOne
扩展指令微调语言模型
扩展到540B个参数和1.8K个任务图 4 表 3 作者首先通过在模型大小和微调任务数量两个方面进行扩展来考察对保留任务性能的影响。对三种PaLM模型大小进行实验：8B、62B和540B。图4显示了扩展这两个变量对保留基准的归一化平均值的联合影响。各个基准的结果在表3中报告。首先发现对于所展示的三种模型大小，与无微调相比，多任务指令微调显著提高了性能。总体而言，绘制的扩展曲线表明未来的工作应该继续扩展指令微调。使用链式思维注释进行微调表 4 作者首先展示了将九个具有链式思维（CoT）注释的数据集包含在微调混合中如何提高推理能力。表格4还展示了如何将CoT提示与自我一致性（SC）结合起来，在多个基准上实现了新的最佳表现。例如，在MMLU基准上，Flan-PaLM 540B实现了75.2%的成绩。这相比于先前的模型有明显优势。指令微调大幅改善了所有模型类型的标准化平均性能。对于没有进行指令微调的T5模型，作者使用了进行语言建模的标准目标在C4上训练的经过LM适应的模型。
74130编辑于 2023-09-19
来自专栏深圳架构师同盟
LoRA大模型微调介绍
一、微调流程二、选择微调基础模型如果我们需要进行的是监督指令微调，建议选择带-Instruct后缀的模型，关于模型命名及后缀说明如下截图：三、准备意图识别微调训练集和验证集提醒：从开源平台（如Hugging 也就是告诉模型在训练过程中 “学习” 的速度有多快。学习率越大，模型每次调整的幅度就越大；学习率越小，调整的幅度就越小。建议大家一开始使用比较小的学习率比较好，例如5e-5、4e-5 这种。然后看情况看模型效果，慢慢调高或者。特别是小数据集的朋友们，一开始不要用特别大的学习率。例如1e-4、2e-4这种的。总的来说，小一点的学习率确实比较好拟合。也有不错的效果。秩的数值越小，模型微调时的参数更新越 “保守”；秩的数值越大，模型能捕捉的特征复杂度越高，但也会消耗更多计算资源。五、模型微调后验证通过预留的10%的微调数据集用做训练后的模型验证集。模型验证数据集中可以加上对应训练时的提示词，如：你是一个意图识别专家，可以根据用户的问题识别出意图，并返回对应的函数调用和参数。
44810编辑于 2026-01-21
来自专栏深度学习自然语言处理
GLoRA—高效微调模型参数！
FacT：FacT提出使用张量分解方法来存储额外的权重，将模型的权重张量化为单个3D张量，然后将其相加分解为轻量级因子。在微调中，只有因子会被更新和存储。根据之前的工作，本文评估了shot为1、2、4、8和16下的结果。它们之间的区别仅在于搜索空间中的LoRA维度，该维度在最大模型中为8和4，在中间模型中为4和2，在最小模型中为2。本文方法中增加的参数灵活性允许在最终模型中进行用户定义的可训练参数计数。通过PETL方法微调的模型应该表现出增强的域泛化能力，从而使它们更适用于现实场景。下表展示了GLoRA的域外泛化能力，其中单个ImageNet-1K微调的GLoRA模型经过域外数据集的测试。总结本文提出了GLoRA，这是一种广义参数高效的微调方法，它成功地证明了增强大规模预训练模型的微调和迁移学习能力的有效性。
85610编辑于 2023-08-22
来自专栏新智元
最强API调用模型来了！基于LLaMA微调，性能超过GPT-4
这不，研究人员搞了个Gorilla，一个经过微调的基于LLaMA的模型，它在编写API调用上的性能甚至超过了GPT-4。然后，研究人员再对Gorilla进行微调，这是一个基于LLaMA-7B的模型，使用研究人员的数据集进行文档检索的操作。在self-instruct范式的指导下，研究人员采用GPT-4来生成合成指令数据。研究人员提供了三个语境中的例子，以及一个参考的API文档，并责成模型生成调用API的真实用例。为了对LLaMA进行微调，研究人员将其转换为用户——代理的聊天式对话，其中每个数据点都是一个对话，用户和代理轮流交谈。然后研究人员在基础的LLaMA-7B模型上进行标准的指令微调。在研究人员收集的三个大规模数据集中，Gorilla的性能超过了最先进的LLM（GPT-4）。Gorilla产生了可靠的API调用ML模型，且没有产生幻觉，并能在挑选API时满足约束条件。
51610编辑于 2023-08-05
【大模型微调】一文掌握5种大模型微调的方法
（典型需求：微调7B模型需4×A100显卡。） 3、QLoRA-极致压缩的微调方案QLoRA（Quantized Low-Rank Adaptation）是LoRA的“量化增强版”，通过将预训练模型量化为4位精度，进一步压低了微调的内存门槛。工作原理：将预训练模型权重量化为4位并永久冻结，在需要计算时将权重反量化为16位精度以进行前向/反向传播，同时采用LoRA的策略引入并训练低秩适配器，并将所有计算产生的梯度都保存在16位下以确保训练精度 4、适配器调整-模块化设计的智慧适配器调整（Adapter Tuning）是一种“模块化插件”式的微调，通过在Transformer层中串行插入小型神经网络模块来适应新任务。从技术演进的角度看，QLoRA是针对LoRA在显存消耗方面的缺陷改进而来，它通过引入4位量化、双重量化及分页优化器等方式，使得微调超大模型所需的显存大幅降低，解决了资源有限的开发者难以触碰大模型的根本问题
3.5K40编辑于 2025-10-23
来自专栏数据分析与挖掘
pycaret之训练模型（创建模型、比较模型、微调模型）
1、比较模型这是我们建议在任何受监管实验的工作流程中的第一步。此功能使用默认的超参数训练模型库中的所有模型，并使用交叉验证评估性能指标。它返回经过训练的模型对象。默认情况下，所有指标均四舍五入为4位小数，可以使用create_model中的round参数进行更改。 3、微调模型在任何模块中调整机器学习模型的超参数就像编写tune_model一样简单。它使用带有完全可定制的预定义网格的随机网格搜索来调整作为估计量传递的模型的超参数。默认情况下，所有指标均四舍五入到4位小数，可以使用round参数进行更改。 PyCaret中的音调模型功能是对预定义搜索空间进行的随机网格搜索，因此它依赖于搜索空间的迭代次数。 "max_features": np.random.randint(1, len(data.columns),20), "min_samples_leaf": [2,3,4,5,6
2.7K10发布于 2020-10-27
来自专栏机器学习与统计学
微调大模型，门槛低到离谱
Unsloth 会自动安装依赖、下载模型、开始训练。你甚至不需要自己有 GPU，用 Google 的免费 T4 就能微调 8B 参数的大模型，真正的零成本入门。不止是"会跑"：看看社区微调出了什么来看几个在 Hugging Face 上火爆的微调模型： 1. _(4B "▶️ 免费运行")-Vision.ipynb) Gemma3N (4B) 对话微调 [▶️ 免费运行](https://colab.research.google.com/github/unslothai k_m") 就这么多代码，你就能：加载一个 8B 参数模型 → 4-bit 量化 → LoRA 微调 → 导出 GGUF → 用 Ollama 本地跑。 DeepSeek V3+R1 满血微调工具一键启动，硬件要求降 10 倍大模型微调实战，教程 + 代码微调一个视觉大模型，手写数字识别为例，从零开始，基于 Qwen2.5，附代码！
72310编辑于 2026-03-02
来自专栏猿人谷
大语言模型的微调策略
本文章讲大语言模型的微调策略及基于 ChatGPT 的微调。一.大语言模型的微调策略微调是让预训练的大语言模型适应特定领域任务的关键技术。根据不同的需求和资源用户可以选择全面微调或参数高效微调。经过验证，通过优化提示词嵌入，模型能够适应特定任务的需求，而不需要微调所有模型参数。（4）LoRA （Low-Rank Adaptation）通过引入低秩矩阵来实现参数更新。 OpenAI声称，最终的定制模型在某些特定任务上可以匹配或超过GPT-4的能力。也就是说，每个企业或个人将拥有自己的专属OpenAI。使用微调模型：完成微调之后，就可以使用微调模型了。（4）内容循序渐进，初学与进阶开发者友好：全书由浅入深、结构清晰，从基础认知到高级实战，兼顾知识体系构建与动手能力提升，既适合AI开发初学者，也能帮助有经验的工程师补齐短板。
62510编辑于 2025-10-21
来自专栏CSDN博客
微调Whisper模型和加速推理
本项目主要的目的是为了对Whisper模型使用Lora进行微调，目前开源了好几个模型，具体可以在openai查看，下面列出了常用的几个模型。 finetune.py：微调模型。 merge_lora.py：合并Whisper和Lora的模型。 evaluation.py：评估使用微调后的模型或者Whisper原模型。准备好数据之后，就可以开始微调模型了。微调完成之后会有两个模型，第一个是Whisper基础模型，第二个是Lora模型，需要把这两个模型合并之后才能之后的操作。提示：没有微调的模型，可能输出带有标点符号，影响准确率。其他更多的参数请查看这个程序。
3K30编辑于 2023-04-30

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

4张图片就可以微调扩散模型

大模型微调

ChatGLM模型微调

PyTorch模型微调实例

GLM4大模型微调入门实战（完整代码）

对于大模型，到底微调还是不微调？

解读大模型的微调

聊聊GLM-4-9B开源模型的微调loss计算

Datawhale出品：《GLM-4 大模型部署微调教程》发布！

迁移学习与模型微调

大模型微调方法总结

扩展指令微调语言模型

LoRA大模型微调介绍

GLoRA—高效微调模型参数！

最强API调用模型来了！基于LLaMA微调，性能超过GPT-4

【大模型微调】一文掌握5种大模型微调的方法

pycaret之训练模型（创建模型、比较模型、微调模型）

微调大模型，门槛低到离谱

大语言模型的微调策略

微调Whisper模型和加速推理

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐