搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

CLIP, DINO等多模型融合DreamSim，让电脑“看懂”图片有多像！模型融合成为热门！
DreamSim不是要另起炉灶，而是很聪明地把已有的老牌嵌入模型（CLIP, DINO, OpenCLIP）拿来，融合起来。就像请了一个专家团：CLIP 擅长语义理解（知道是啥）。但真正的魔法在这里：这个融合后的结果，会用海量的人类主观判断数据进行微调。这就是独门秘籍。模型不仅仅是从原始数据中学习，而是在学习像我们人类一样去看图像。他们用AI扩散模型生成了一个巨大的图像三元组数据集（NIGHTS）。速度与精度的权衡：总有一款适合你全能冠军（默认集成模型）：精度最高，与人类判断一致性可达96%以上，适合对精度要求高的场景。轻量快手（单分支模型）：比如只使用DINO主干，速度提升近3倍，精度略有牺牲，适合需要快速响应的应用。
49810编辑于 2025-10-16
来自专栏全栈程序员必看
多模型融合权重如何训练_单因子模型
结构化多因子风险模型首先对收益率进行简单的线性分解，分解方程中包含四个组成部分：股票收益率、因子暴露、因子收益率和特质因子收益率。组合权重优化组合权重优化在多因子模型中起到了至关重要的作用。组合权重优化的目的在于将组合的风险特征完全定量化，使得投资经理可以清楚的了解组合的收益来源和风险暴露。具体权重优化表达为： 3）最大化组合信息比率最大化组合信息比率为目标函数以预期收益与预期组合风险的比值作为目标函数，具体权重优化表达为：上述三种优化目标函数中，第一种方法和第三种方法完全依赖风险模型给定的数据结果进行计算，发现组合满足行业中性的约束：同时也满足风格中性的约束：如果我们想使得组合在行业和风格因子上的风险敞口较基准而言有所暴露，我们直接修改约束条件就行，比如我们想在价值因子（Value）上多暴露最后贴出源码和策略克隆链接：基于Barra多因子模型的组合权重优化版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
1.6K20编辑于 2022-11-08
来自专栏机器之心
苹果发现原生多模态模型Scaling Laws：早融合优于后融合，MoE优于密集模型
此外，对于多模态 Scaling Laws 的研究表明，随着计算预算的增加，早融合和后融合的计算最优模型性能相似。原生多模态模型的 scaling 属性下面具体展示原生多模态模型的 Scaling Laws。 NMM 的 Scaling Laws 早融合和后融合模型的 Scaling Laws。图 2 左图展示了早融合 NMM 在多模态交织数据集、图像 - 描述数据集和文本数据集上的平均最终损失。考虑到预训练的成本，这些结果表明，为了在多模态基准测试中实现相同性能，原生训练可能是更有效方法。迈向多模态专业化研究证明了在固定计算预算下，早融合模型的性能与后融合模型相当。具体而言，早融合优于后融合，而多模态 MoE 优于密集模型。然而，由于这些模型规模相对较小（15 亿规模）、从零开始训练，并在小型数据集上进行微调，因此总体得分低于目前的 SOTA 水平。
52110编辑于 2025-04-13
来自专栏PPV课数据科学社区
多模型融合推荐算法——从原理到实践
但是其中一类方法非常特殊，我们称为多模型融合算法。融合算法的意思是，将多个推荐算法通过特定的方式组合的方法。融合在推荐系统中扮演着极为重要的作用，本文结合达观数据的实践经验为大家进行系统性的介绍。常见的多模型融合算法达观数据的众多实践发现，多模型融合算法可以比单一模型算法有极为明显的效果提升。但是怎样进行有效的融合，充分发挥各个算法的长处？ 2）交叉融合法交叉融合常被称为Blending方法，其思路是在推荐结果中，穿插不同推荐模型的结果，以确保结果的多样性。通过特征融合的方法能确保模型不挑食，扩大适用面。 5）预测融合法推荐算法也可以被视为一种“预测算法”，即我们为每个用户来预测他接下来最有可能喜欢的商品。通过模型进行融合往往效果最好，但实现代价和计算开销也比较大。达观的多级融合技术在达观数据（http://datagrand.com）的实践中，采用的多级融合架构如下： ?
3.4K80发布于 2018-04-24
来自专栏达观数据
多模型融合推荐算法在达观数据的运用
多模型融合推荐算法在达观数据的运用研发背景互联网时代也是信息爆炸的时代，内容太多，而用户的时间太少，如何选择成了难题。但是其中一类方法非常特殊，我们称为多模型融合算法。融合算法的意思是，将多个推荐算法通过特定的方式组合的方法。融合在推荐系统中扮演着极为重要的作用，本文结合达观数据的实践经验为大家进行系统性的介绍。常见的多模型融合算法达观数据的众多实践发现，多模型融合算法可以比单一模型算法有极为明显的效果提升。但是怎样进行有效的融合，充分发挥各个算法的长处？（达观数据纪达麒陈运文） 3）瀑布融合法瀑布型（Waterfall Model）融合方法采用了将多个模型串联的方法。通过模型进行融合往往效果最好，但实现代价和计算开销也比较大。达观的多级融合技术在达观数据（http://datagrand.com）的实践中，采用的多级融合架构如下： ?
1.9K60发布于 2018-03-30
来自专栏技术汇总专栏
基于大模型的多模态数据融合实战应用
基于大模型的多模态数据融合实战应用引言多模态数据融合是当前人工智能（AI）研究的热门领域，涉及文本、图像、音频、视频等多种数据类型的集成。本文将探讨基于大模型的多模态数据融合方法，并通过 Python 代码示例演示如何构建多模态应用。基于大模型的多模态数据融合案例我们以 BLIP-2（Bootstrapped Language-Image Pre-training）为例，展示如何使用大模型进行图像和文本的多模态融合。文本生成：使用大规模 Transformer 语言模型（如 T5）生成描述文本。端到端融合：输入图像，输出文本，形成完整的图文多模态处理流程。结合两者，形成完整的语音+文本融合应用。多模态融合的应用场景基于大模型的多模态数据融合可以应用于多个领域，包括：智能问答：图像+文本结合，支持输入图片进行描述或问答（如 GPT-4V）。
4.4K10编辑于 2025-03-03
来自专栏Python与算法之美
超越stacking, 使用optuna对多模型进行加权融合
多模型加权融合是一个常见的提升机器学习效果的方案。但是各个模型的权重如何确定呢？由于optuna是一个强大的不可微问题调优工具，我们可以使用它来寻找模型融合的权重，直接对auc,acc等不可微的评价指标进行优化，当给予足够的搜索次数时，其结果相比stacking ensemble通常更加有竞争力 print("stacking_score:",get_test_auc(stacking)) stacking_score: 0.9304879610655739 可以看到，stacking模型融合方案相比于最好的 svm模型在测试集的AUC提升了0.67个百分点，达到了0.9305 # 五，获取CV预测结果 # 为了充分利用训练数据集，采用类似stacking的方式，用5折CV的方式获取各个模型在训练集的预测结果 optuna_ensemble_score:', test_score(best_params)) optuna_ensemble_score: 0.9320248463114754 nice，optuna多模型融合方案在测试集
1.5K41编辑于 2023-02-23
融合Transformer与CNN的多模态时间序列预测模型
引言:融合Transformer与CNN的多模态时间序列预测模型在人工智能落地工业场景的进程中，时间序列预测始终是核心痛点——无论是设备监测的故障预警、气象数据的灾害预判，还是股票市场的趋势分析，传统模型要么难以捕捉长时依赖而Transformer的注意力机制擅长挖掘长序列关联，CNN则在局部特征提取上表现优异，将两者融合构建多模态预测模型，成为突破性能瓶颈的关键方向。本文将原创改进一款融合Transformer与CNN的多模态时间序列预测模型，从架构设计、代码实现到NASA数据集实战，全程拆解落地流程。，容易出现梯度消失或信息衰减，无法精准挖掘远期关联特征；多模态数据适配缺失：实际工业场景中，时序数据常伴随多源模态（如设备监测的振动数据+温度数据、气象预测的气压数据+湿度数据），传统模型难以有效融合跨模态信息二、原创模型架构：Transformer与CNN的融合设计本次改进模型的核心思路是：通过CNN分支提取各模态时序数据的局部关键特征，通过Transformer分支捕捉跨时间步的长时关联，最后通过融合层整合多模态特征并输出预测结果
77310编辑于 2025-12-31
来自专栏mathor
模型融合
一般来说，通过融合多个不同模型的结果，可以提升最终的成绩，所以这以方法在各种数据竞赛中应用非常广泛。模型融合又可以从模型结果、模型自身、样本集等不同的角度进行融合。，准确率更高，所以我们无论用什么方式，都应该给第二个模型的预测值赋予更高的权重 # 加权融合，权重的默认值是(1/n)，n为模型个数，相当于默认使用平均加权融合 def weighted_method( # 结果 Weighted_pre MAE: 0.0575 上述加权融合的技术是从模型结果的层面进行的，就是让每个模型跑一遍结果，然后对所有的结果进行融合，当然融合的方式不只有加权平均，还有例如平均更多详情可以参考这篇博客模型融合方法学习总结 3. 模型自身的融合方面，我们学习了Stacking和Blending的原理及具体实现方法，介绍了mlxtend库里面的模型融合工具 ?
2K20发布于 2020-04-08
来自专栏机器学习AI算法工程
全球AI挑战-场景分类的比赛源码(多模型融合)
、Inception-Resnet-V3模型 imgaug 图片数据增强库替换Keras自带的图片预处理支持多进程进行图片预处理血训数据增强很重要！！！ Fine-tune时松太开，可能导致训练耗时，也可能导致机器带不动；绑太紧可能导致Fixed的权重参数扼制了模型的学习能力。建议是在机器能扛得住的基础下，尽可能松绑多一些。提高2~5个百分点模型选择很重要！！！糟糕的模型训练几天几夜，可能赶不上优势模型训练几个epoch。VGG16=>Xception提高5~8个百分点 Loss降不下去时尝试调低LR！！！训练过程中一直没有过拟合，要从两方面考虑：模型太简单，拟合能力不足，这时要考虑增强网络复杂度数据增强程度太大，学不到某些特征模型集成！！！单模型没有什么提升空间时，要尝试将多个单模型进行集成。集成的方式可以选择投票法、均值法、按照模型Acc加权法等等。提高0.5~1.5个百分点预测数据增强！！！
1.1K21发布于 2019-10-28
来自专栏机器学习与统计学
玩转机器学习：基于多损失函数的模型融合
基于多损失函数的模型融合原理其实很简单，利用不同损失函数的特性，结合使用不同损失函数分别训练多个模型，将多个训练得到的模型结果进行加权平均或分段预测。这里我们使用的是MAE 和 MSE：平均绝对差值(MAE) 绝对误差的平均值，通常用来衡量模型预测结果对标准结果的接近程度。 ? 来源见水印可以看出，MSE对误差进行了平方，这就会放大误差之间的差距，也即加大对异常值的惩罚，在高分段和低分段能获得更好的表现，使用MAE的模型在中分段能获得更好的表现。因此可以结合使用以MSE和MAE为损失函数的模型，分段进行预测。注：单模型而言，如果数据的异常值对于业务是有用的，我们希望考虑到这些异常值，那么就用MSE。模型融合实例书中使用lightgbm建模并进行融合，只列出关键代码。 ?
1.9K30发布于 2020-06-16
来自专栏pydata
模型融合
具体到损失函数本身的选择，如果选择平方损失函数，差值就是所说的残差让损失函数沿着梯度方向下降，就是gbdt的gb的核心，利用损失函数的负梯度在当前模型的值作为回归问题提升树算法中的残差的近似值去拟合一个回归树 gbdt每轮迭代的时候，都去拟合损失函数在当前模型下的负梯度。 Adaboost是通过提升错分数据点的权重来定位模型的不足，而Gradient Boosting是通过算梯度来定位模型的不足。
60530发布于 2018-08-02
来自专栏点云PCL
多帧数据融合思路
一.对数据的输入 A、如何获取你的点云数据（使用什么设备，查找相应设备的介绍，设备的精度、稳定度、抗噪能力、数据的可视深度范围等，采用无标记点融合，或标记点融合；要考虑多帧数据之间的旋转角度）； B、如何将你的数据对象从环境中分割出来（识别分割、手动分割CC），深度学习若能做分割，并且针对特定对象的效果还行的话，再结合PCL做多帧数据的融合，是一个创新点（前提是提高效率）； C、对数据的输入输出要掌握，一般程序都是一样的，复制粘贴即可二、对数据的预处理（融合肯定至少两帧数据） A、数据是否有噪声：根据噪声的类别，选择合适的算法进行去除（直通滤波、条件滤波、统计滤波、双边滤波等等）； B、数据是否需要下采样：体素栅格滤波（参数的设置，根据自己的目的，参考北航出的国内唯一一本PCL的书，同时兼顾PCL官网的更新内容）； B、精配准执行前的准备：是否建立空间拓扑关系（一般需要建立，加快计算速度）； C、是否需要剔除错误点对（一般需要剔除，提高融合精度书以及官网都可查阅）； D、执行计算，并输出精配准融合点云对象，输出精配R和T，输出精配时间，并可视化（保存或可视化都行）。
2.5K20发布于 2019-07-30
来自专栏全栈程序员必看
blender模型(sklearn模型融合)
几种方式融合基本的模型融合组合及适用场景、优缺点等什么是融合？构建并结合多个学习器来完成学习任务，我们把它称为模型融合或者集成学习。基本的融合方式有： Blending Stacking 选择融合模型的模型有两点要求：准确性要求该模型的性能不能太差差异性选择模型一般是多个，要求这多个模型之间有差异，有差异才能通过融合模型发挥他们的优势那么一些基本的融合方式就是： Uniform Blending (均匀融合) 少数服从多数思想，投票模型，直接可以根据多个模型结果做判断。，这样就会有很多模型产生，也就是会形成多份“训练集Predictions”以及多份“测试集Predictions”，这样在第二层建立的模型及预测的结果相对会好一些。大家就算是来尝试一下这个模型融合的流程。
1K30编辑于 2022-08-01
来自专栏AI智韵
【多模态大模型实战】搭建DeepSeek Janus-Pro 7B 多模态模型，以及推理微调，推理后的模型融合
模型信息 Janus-Pro是DeepSeek最新开源的多模态模型，是一种新颖的自回归框架，统一了多模态理解和生成。，现已支持450+大模型与150+多模态大模型的训练（预训练、微调、人类对齐）、推理、评测、量化与部署。目前ms-swift的主要能力包含：模型类型：支持450+纯文本大模型、150+多模态大模型，All-to-All全模态模型的训练到部署全流程。工具箱能力：除了对大模型和多模态大模型的训练支持外，还支持其推理、评测、量化和部署全流程。模型评测：以EvalScope作为评测后端，支持100+评测数据集对纯文本和多模态模型进行评测。
4.2K10编辑于 2025-02-08
来自专栏全栈程序员必看
模型融合stacking实战
模型融合stacking的原理具体不再解释，有的博客已经解释很清楚了，还是附一张经典图吧，直接上完整程序（根据后面的数据集下载地址可以下载数据集，然后直接运行程序）： # Load in our 最终得到预测结果predictions，这个结果也就是融合后的预测结果。
58741编辑于 2022-07-25
来自专栏s09g的技术博客
多传感融合 Lidar and Radar Fusion
对于无人驾驶系统而言，多传感器已经是默认配置一个简单的感知反馈模型其实只有两步：状态预测与测量更新在多传感器条件下，各传感器之间想要同步反馈速度其实并无必要。
83920编辑于 2022-07-06
来自专栏时空探索之旅
KDD 2025 | MDPNet：融合多尺度分解与扩散模型的时空预测
预测的准确性，取决于模型能否捕捉到系统内在的动态规律。它巧妙地利用复杂系统的多尺度结构，来发现其内在动态所在的潜在空间。首先，MDPNet包含了一个多尺度扩散自编码器，通过编码多尺度特征来引导扩散模型进行可靠的重构。其核心思想是，将编码器提取的多尺度潜在向量作为条件，去引导扩散模型在不同时间步的去噪（重构）过程。结果显示，MDPNet的多尺度方法能够更高效地利用潜在空间的容量。如下图所示，MDPNet在64维时已接近性能饱和点，显著优于需要更大维度才能收敛的基线模型，证明了其表征能力的优越性。图6：模型性能随潜在维度的变化。MDPNet（绿色）在更低的维度上达到了比基线模型更高的精度多尺度分解的必要性：直接证据表明，MDPNet显式地解耦多尺度信息是提升性能的关键。
93110编辑于 2025-06-19
来自专栏全栈程序员必看
多模态融合技术综述和应用
文章目录多模态技术基础 1，多模态融合架构（神经网络模型的基本结构形式） 1.1联合架构 1.2协同架构 1.3编解码架构（自监督） 2，多模态融合方法 2.1早期融合 2.2 晚期融合 2.3混合融合所以融合多模态的特征可以使得模型学到的特征越完整，也是符合人类进化的表现，人类在多种行动与决策都会综合多个模态信息，比如视觉、听觉、嗅觉等。 1，多模态融合架构（神经网络模型的基本结构形式）多模态融合的主要目标是缩小模态间的异质性差异，同时保持各模态特定语义的完整性，并在深度学习模型中取得最优的性能。 2，多模态融合方法将多模态融合方法分为两大类：模型无关的方法和基于模型的方法，前者不直接依赖于特定的深度学习方法，后者利用深度学习模型显式地解决多模态融合问题，例如基于核的方法、图像模型方法和神经网络方法等 2.2 晚期融合晚期融合在每种模式输出结果（例如输出分类或回归结果）之后才执行集成。晚期融合也叫决策级融合，深度学习模型先对不同的模态进行训练，再融合多个模型输出的结果。
16.3K23编辑于 2022-07-02
深度学习进阶（二）——视觉与语言的融合：多模态模型的架构演化
从那一刻开始，我们进入了多模态时代—— 模型不再只是“识别”，而是“理解”。二、什么是多模态：不仅是拼接输入在机器学习中，“模态（Modality）”指信息的来源类型。然而，它的局限也很明显：模型难以真正理解“哪部分图对应哪句话”；语言生成过于模板化，容易出现模式坍塌；不同模态间的信息融合过浅。模态不平衡语言数据极多，图像和视频成本高，导致模型在语义学习上偏向语言。 3. 计算成本高训练一个多模态模型通常需要上千张 GPU，工程门槛极高。 4. 未来的多模态模型可能具备以下特征：统一输入接口：一切输入（文字、图片、声音）都以 token 形式表示；动态模态融合：模型根据任务自动选择关注模态；通用语义空间：所有信息都在统一向量空间中交互它们在模型中，融合成一种新的语义形式——一种机器能理解的世界语言。而我们离真正的“通用人工智能”，或许就隔着一个更强大的多模态 Transformer。
77110编辑于 2025-10-22

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

CLIP, DINO等多模型融合DreamSim，让电脑“看懂”图片有多像！模型融合成为热门！

多模型融合权重如何训练_单因子模型

苹果发现原生多模态模型Scaling Laws：早融合优于后融合，MoE优于密集模型

多模型融合推荐算法——从原理到实践

多模型融合推荐算法在达观数据的运用

基于大模型的多模态数据融合实战应用

超越stacking, 使用optuna对多模型进行加权融合

融合Transformer与CNN的多模态时间序列预测模型

模型融合

全球AI挑战-场景分类的比赛源码(多模型融合)

玩转机器学习：基于多损失函数的模型融合

模型融合

多帧数据融合思路

blender模型(sklearn模型融合)

【多模态大模型实战】搭建DeepSeek Janus-Pro 7B 多模态模型，以及推理微调，推理后的模型融合

模型融合stacking实战

多传感融合 Lidar and Radar Fusion

KDD 2025 | MDPNet：融合多尺度分解与扩散模型的时空预测

多模态融合技术综述和应用

深度学习进阶（二）——视觉与语言的融合：多模态模型的架构演化

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

CLIP, DINO等多模型融合DreamSim，让电脑“看懂”图片有多像！模型融合成为热门！

多模型融合权重如何训练_单因子模型

苹果发现原生多模态模型Scaling Laws：早融合优于后融合，MoE优于密集模型

多模型融合推荐算法——从原理到实践

多模型融合推荐算法在达观数据的运用

基于大模型的多模态数据融合实战应用

超越stacking, 使用optuna对多模型进行加权融合

融合Transformer与CNN的多模态时间序列预测模型

模型融合

全球AI挑战-场景分类的比赛源码(多模型融合)

玩转机器学习：基于多损失函数的模型融合

模型融合

多帧数据融合思路

blender模型(sklearn模型融合)

【多模态大模型实战】 搭建DeepSeek Janus-Pro 7B 多模态模型，以及推理微调，推理后的模型融合

模型融合stacking实战

多传感融合 Lidar and Radar Fusion

KDD 2025 | MDPNet：融合多尺度分解与扩散模型的时空预测

多模态融合技术综述和应用

深度学习进阶（二）——视觉与语言的融合：多模态模型的架构演化

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

【多模态大模型实战】搭建DeepSeek Janus-Pro 7B 多模态模型，以及推理微调，推理后的模型融合