搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏AiCharm
训练开销骤减，10%成本定制专属类GPT-4多模态大模型
本文来自新加坡国立大学和清华大学的研究者提出了一个名为 VPGTrans 框架，以极低成本训练高性能多模态大模型。多模态大模型定制：通过我们的 VPGTrans 框架可以根据需求为各种新的大语言模型灵活添加视觉模块。开源多模态对话模型：我们开源了 VL-Vicuna，可实现高质量的多模态对话：图２：VL-Vicuna 的交互实例一、动机介绍 1.1 背景 2023 年是 AI 元年，以 ChatGPT 为代表的大语言模型比如，LLM 在多模态理解领域掀起了一股从传统预训练视觉语言模型 (VLM) 到基于大语言模型的视觉语言模型 (VL-LLM) 的变革。 b) TaS 场景下，越小的语言模型上训练的 VPG，迁移到大模型时效率越高，最终效果越好。c) TaT 场景下，越小的模型之间迁移的 gap 越大。
48320编辑于 2023-06-07
来自专栏机器之心
训练开销骤减，10%成本定制专属类GPT-4多模态大模型
，比如 GPT-4、BLIP-2、Flamingo 等。本文来自新加坡国立大学和清华大学的研究者提出了一个名为 VPGTrans 框架，以极低成本训练高性能多模态大模型。多模态大模型定制：通过我们的 VPGTrans 框架可以根据需求为各种新的大语言模型灵活添加视觉模块。比如，LLM 在多模态理解领域掀起了一股从传统预训练视觉语言模型 (VLM) 到基于大语言模型的视觉语言模型 (VL-LLM) 的变革。 b) TaS 场景下，越小的语言模型上训练的 VPG，迁移到大模型时效率越高，最终效果越好。c) TaT 场景下，越小的模型之间迁移的 gap 越大。
55920编辑于 2023-05-22
来自专栏深度学习自然语言处理
VPGTrans: 10%的成本定制你自己的类GPT-4多模态大模型
夕小瑶科技说分享作者 | 张傲进NLP群—>加入NLP交流群最近的多模态（对话）大模型将基于文本的ChatGPT的强大能力扩展到了多模态输入，实现强大的多模态语义理解，比如GPT-4、BLIP 多模态大模型定制通过我们的VPGTrans框架可以根据需求为各种新的大语言模型灵活添加视觉模块。比如我们在LLaMA-7B和Vicuna-7B基础上制作了VL-LLaMA和VL-Vicuna。为代表的大语言模型(LLM)大火。比如，LLM在多模态理解领域掀起了一股从传统预训练视觉语言模型(VLM)到基于大语言模型的视觉语言模型(VL-LLM)的变革。 b) TaS场景下，越小的语言模型上训练的VPG，迁移到大模型时效率越高，最终效果越好。c) TaT场景下，越小的模型之间迁移的gap越大。
38220编辑于 2023-08-22
来自专栏后台技术汇
大模型应用之（4）：Langchain架构与大模型接入
作为一个语言模型集成框架，LangChain 的用例与一般语言模型的用例有很大的重叠。重叠范围包括文档分析和总结摘要, 代码分析和聊天机器人。 Langchain架构 LangChain工具组件：大模型包装器、聊天模型包装器、数据增强工具和接口链：提供了标准接口，和数据平台和实际应用工具紧密集成 LangChain六大模块模块核心作用 Agent作为高级模块，可调用其他所有模块功能大模型接入接入示例云服务和私有化大模型优劣对比维度开发成本算力成本运维成本数据安全云厂商大模型较低，开箱即用算力资源充足，大模型性能好 &吞吐量较高较低，提供云平台监控安全性低私有化大模型较高，自建大模型网关、服务鉴权、可用性等算力硬件投入成本高，大模型性能较差低&吞吐量较低较高，需要专业运维团队介入安全性高，保密性强小结： - 研发&测试环境：为了方便部署和测试，使用云服务 - 大客户生产环境：安全审核严格，大多数采用自建大模型的方式总结 LangChain 是什么？
70810编辑于 2025-08-04
来自专栏大模型成长之路
【大模型学习 | MINIGPT-4原理】
MINIGPT-4: ENHANCING VISION-LANGUAGE UNDERSTANDING WITH ADVANCED LARGE LANGUAGE MODELS在GPT4未开源的情况下，作者认为其表现优越是因为采用了最为先进的 LLM模型，因此，作者在BLIP2的基础上，将LLM模型替换为了Vicuna，同样也是通过一个线性映射层将图像表征映射为LLM的输入。开源代码：https://minigpt-4.github.io/一、预训练方法预训练方法几乎和BLIP2模型一致，可以参考：【大模型学习 | BLIP2原理】-腾讯云开发者社区-腾讯云1.1 Q-Former ； MINI-GPT4表现比BLIP2要强上许多？ ① MiniGPT-4 使用的是 Vicuna（基于 LLaMA 的开源 ChatGPT 对话模型），具有更强的自然语言表达和指令理解能力；而BLIP-2 使用的 LLM 主要是 Flan-T5 或 OPT
73910编辑于 2025-07-02
来自专栏日常记录。。。
2024年企业软件定制开发必须了解的4大趋势
因此，企业十分有必要了解最新的技术发展趋势，以确保定制的企业软件解决方案时刻保持最新状态，并且能够高效运行。生成式人工智能模型可以用于预测市场动向和消费者行为，以帮助企业基于数据快速做出决策。AI驱动的计算机视觉技术可以自动追踪库存，并通过监测异常行为提升企业场所的安全性。 2、完整的服务流程上，飞算科技针对不同行业推出定制化服务,为客户提供高质量、高效率及高满意度的定制化合作以及无忧的售后运维服务，协助客户共同验证和完善企业商业模式的体系。以近期飞算科技为天禹数智定制化开发的全链路智能拓客系统—“销管家”为例,可以实现“全域获客”、“一键分销”、“私域激活”、“数据追踪”、“直播变现”及“业务管理”六大功能。截至目前已为包括医疗、金融、制造、零售等在内的八大行业的上百家机构提供了技术服务，加速其数字化转型进程。
59810编辑于 2023-11-22
来自专栏算法一只狗
LLama4 原生多模态大模型
Meta最新发布了原生多模态大模型 Llama 4，一经亮相即登上LMSYS大模型排行榜第二名，仅次于Google的Gemini-2.5-pro，分差仅为22分，实力可见一斑。在模型规模方面，Llama 4系列的确非常庞大，尤其是Behemoth模型，远超业内主流，例如DeepSeek R1参数量仅为6710亿，只有Behemoth的约三分之一。当前行业趋势多偏向小而高效的模型，Llama 4如此庞大的规模实属少见。总结与展望Llama 4的发布，意味着Meta正式进入原生多模态大模型竞争核心领域。相比Gemini系列、GPT-4o、Claude 3、DeepSeek等主流模型，Llama 4以务实高效的技术路线，突出计算成本、推理效率与多模态能力的平衡。
77500编辑于 2025-05-01
来自专栏量子位
大模型恋爱神器！16种MBTI自由定制，北大ChatLaw团队出品
Jiaxi 投稿自凹非寺量子位 | 公众号 QbitAI 北大团队新作，让大模型拥有个性！而且还是自定义那种，16种MBTI都能选。这样一来，即便是同一个大模型，不同性格下的回答都不一样。 ENFP的大模型会说：喜欢参加社交活动，结识新朋友。 INFJ的大模型则回答：喜欢独自读过。这样能干啥呢？北大的童鞋们列出来了一些情景：在特殊节日，给你的男/女朋友寻找心仪的礼物。深入理解大模型的定制化、个性化的方式及可能性。在做出重大决策时，考虑不同情境下的个性特征。通过深入了解人性的复杂性，促进个人成长和相互理解。行为数据集的目的是为了让大模型可以表现出不同性格的回应，这部分是对Alpaca数据集进行个性化修改实现。行为数据集中MBTI四个维度的比例如下：自我意识数据集是为了让大模型能够意识到自己的个性特征。通过一个两阶段的有监督训练微调过程，最后可以得到对应人格的大模型。
98010编辑于 2024-01-17
来自专栏啄木鸟软件测试
多模态大模型技术原理与实战(4)
多模态大模型核心技术 1多模态的困难困难数据集标志困难人工标注生成 COCO Visual Genome ... OpenAl的DALL-E2和GPT4 谷歌大脑的 lmaen和Stable Diffusion 百度的文心一言文本生成图像基于GAN的文本生成图像方法 AlignDRAW:第一个现代文本生成图像模型图像解码器把隐信息还原成图像 4语音多模态技术文本生成语音以前技术：拼接法和参数法基于非深度学习的文本生成语音技术隐马尔可夫模型 (HMM) 文本信息提取模块声学特征提取模块可调整的低秩适配(Adaptive Low-Rank Adaptation，AdaLoRA)技术和量化压缩远程注意力(Quantized Long-Range Attention，QLoRA)技术 8 GPT-4多模型核心技术介绍 Transformer：编码器-解码器框架编码器：衍生出了自编码大模型，如BERT、RoBERT和ALBERT 解码器：衍生出了自回归大模型,如GPT-1和GPT-2 整体衍生出：T5和GLM
46210编辑于 2024-09-10
来自专栏实验盒
NBT｜BioChatter：为生物医学量身定制的开源大语言模型应用平台
引言近年来，生成式人工智能尤其是大语言模型（LLM）取得了显著进展，但在生物医学研究中的应用仍处于起步阶段。 BioChatter是一个开源的Python框架，旨在遵循开放科学原则，开发定制的生物医学研究软件。它还促进了在简单性/经济性与安全性之间的定制部署，用户可以根据自己的需求在公共数据库、自托管云数据库和本地数据库之间进行选择，平衡安全性与成本。系统提示与多智能体系统 BioChatter的可定制平台允许用户通过系统提示将其与自己的上下文对齐，并使用基于智能体的系统进行高级工作流程。基准测试框架在所有模型和相关参数上运行这些测试，并通过BioChatter网站向社区报告结果。
49510编辑于 2025-02-05
来自专栏AI SPPECH
63_模型定制：领域微调技术
引言：为什么需要模型定制与微调 ├── 2. 微调技术体系：从全参数到参数高效 ├── 3. 全参数微调：深度定制的经典路径 ├── 4. 参数高效微调：资源受限下的优化选择 ├── 5. 引言：为什么需要模型定制与微调在2025年的AI生态系统中，通用大语言模型（LLM）如ChatGPT、LLaMA 4、Claude 4等已经展现出惊人的通用能力。然而，当面对特定行业或场景的专业需求时，通用模型往往表现出局限性：术语理解不准确、领域知识不足、任务适配性差等问题。这正是模型定制与微调技术应运而生的背景。全参数微调：深度定制的经典路径全参数微调（Full Fine-tuning）是最传统的微调方法，通过更新预训练模型的所有参数来适应特定任务。通过科学的数据工程、合理的技术选型和系统的评估优化，任何团队都可以构建出高性能、专业化的定制模型。
38710编辑于 2025-11-16
来自专栏科学最Top
近期值得关注的4个时序大模型研究
前言梳理了近期几篇时间序列大模型研究文章（后台回复：“论文合集”获取），时间序列大模型的研究正在迅速发展，并且在多个领域和应用中展现出巨大的潜力。随着技术的不断进步，预计未来会有更多创新的方法和应用出现，但我感觉目前可以重点关注以下三方面：基础模型的构建：研究者们正在尝试构建时间序列预测的基础模型，这些模型可以在不同的时间序列数据集上进行预训练特定领域的应用：大模型正在被应用于特定领域的时间序列预测，如金融、医疗、交通等，以解决特定问题并提供可解释的预测。 4、Lag-Llama 论文标题：Lag-Llama: Towards Foundation Models for Probabilistic Time Series Forecasting 在过去的几年中 Lag-Llama作为时间序列预测领域现有技术的强大竞争者，并为未来针对时间序列数据定制的基础模型的进展铺平了道路。
1.7K10编辑于 2024-09-18
来自专栏拥抱GPT
OpenAI 将向企业开放 GPT-4o 模型定制版，国内怎么使用ChatGPT？
OpenAI 最近发布了一项新功能，使企业客户可以通过微调技术定制 GPT-4o 模型，从而应对日益激烈的人工智能竞争，并展示其投资回报。这一新功能的推出使得企业能够使用自己的数据对 GPT-4o 模型进行个性化调整，以满足他们的特定需求和业务场景。与此前不同，GPT-4o 的企业客户现在可以对模型进行细化训练，而这在之前的版本中是不可实现的。这一新功能特别适用于需要在特定领域进行高效应用的企业。举例来说，一家生产滑板的公司可以微调 GPT-4o 模型，使其成为客户服务聊天机器人，能够解决客户关于滑板轮子、护理方法等非常具体的需求。通过定制 GPT-4o 模型，企业不仅可以提升自身竞争力，还能够在为客户提供个性化解决方案的同时，优化内部工作流程。这项新功能无疑将成为企业推进人工智能战略的重要工具。
30620编辑于 2024-08-21
来自专栏自然语言处理(NLP)论文速递
猛犸象大模型！MAmmoTH：目前最好的开源、通用数学大模型，现已超过GPT-4！
引言大型语言模型 (LLM)的数学推理能力是评估大模型能力的一项关键指标。尽管目前很多大型语言模型(LLMs)在该领域取得了一定的进展，但与闭源的大模型相比，开源大模型的数学推理能力仍然有很大差距。 (LLM)的数学推理能力是评估大模型能力的一项关键指标。尽管该领域取得了一定的进展，但是开源大模型和闭源大模型之间仍然存在明显的差距。目前一些比较流行的闭源LLM主要包括：GPT-4、PaLM-2、 Claude2，它们在主流的GSM8K、MATH数据集上面占据着了主导地位；而Llama、Falcon、OPT等开源大模型在所有基准上都大幅落后
1.7K20编辑于 2023-09-21
来自专栏【腾讯云开发者】
腾讯混元大模型·4月产品动态
作为腾讯全链路自研的大模型，自2023年9月公开亮相以来，腾讯混元大模型共经历了数十次迭代，支持内部超过400个业务和场景接入，并通过腾讯云面向企业和个人开发者全面开放（API个人权益与企业客户一致，已实名腾讯云账号提供累计
56340编辑于 2024-04-28
来自专栏AI分享
大模型有关信息（2025年4月8日 - 4月14日）
Meta发布Llama 4大模型引发争议发布情况：4月13日，Meta平台公司推出了Llama大语言模型新一代版本——Llama 4 Scout和Llama 4 Maverick。专业评估机构LMArena把Llama 4 Maverick的某个版本评为当下性能最强的开源大语言模型，但开发者亲自测试发现，通过不同方式访问时效果差异巨大，Meta高管也承认其表现“参差不齐”“质量不稳定独特优势：Llama 4拥有超大的上下文窗口，一次能处理1000万个token，大约相当于800万个单词，相比OpenAI的GPT-4的上下文窗口优势明显。嘀嗒出行公布大模型应用于客服的进展应用成果：4月14日，嘀嗒出行公布其AI大模型在客服领域的应用进展。基于大模型的智能判责准确率已超过80%，智能工单生成效率提升50%，准确率达98%。小鹏汽车训练物理大模型何小鹏表态：4月14日，小鹏汽车创始人何小鹏在社交平台发帖称，小鹏坚持全栈自研，去年率先在自动驾驶领域引入强化学习、模型蒸馏的路线，并且训练了一个超大规模的物理世界大模型，国内还没有第二家车企可以做到
3.5K20编辑于 2025-04-15
来自专栏AI科技评论
VPGTrans：10% 的成本定制你自己的类 GPT-4 多模态对话模型
最近的多模态（对话）大模型将基于文本的ChatGPT的强大能力扩展到了多模态输入，实现强大的多模态语义理解，比如最近的GPT4、BLIP-2、Flamingo等。多模态大模型定制: 通过我们的VPGTrans框架可以根据需求为各种新的大语言模型灵活添加视觉模块。比如我们在LLaMA-7B和Vicuna-7B基础上制作了VL-LLaMA和VL-Vicuna。为代表的大语言模型(LLM)大火。比如，LLM在多模态理解领域掀起了一股从传统预训练视觉语言模型(VLM)到基于大语言模型的视觉语言模型(VL-LLM)的变革。 4 定制您的VL-LLMs 我们的VPGTrans可以快速为任意新的LLMs添加视觉感知模块，从而得到一个全新的高质量VL-LLM。
73320编辑于 2023-05-12
来自专栏新智元
NUS、清华发布VPGTrans：轻松定制类GPT-4多模态大模型
---- 新智元报道编辑：LRS 好困【新智元导读】最近的多模态（对话）大模型将基于文本的ChatGPT的强大能力扩展到了多模态输入，实现强大的多模态语义理解，比如GPT-4、BLIP-2 今年是AI技术爆发式发展的一年，以ChatGPT为代表的大语言模型（LLM）大火。多模态大模型定制：通过我们的VPGTrans框架可以根据需求为各种新的大语言模型灵活添加视觉模块。比如我们在LLaMA-7B和Vicuna-7B基础上制作了VL-LLaMA和VL-Vicuna。（VLM）到基于大语言模型的视觉语言模型（VL-LLM）的变革。 b) TaS场景下，越小的语言模型上训练的VPG，迁移到大模型时效率越高，最终效果越好。 c) TaT场景下，越小的模型之间迁移的gap越大。
52250编辑于 2023-05-22
来自专栏AI科技评论
为每个用户提供专属定制服务，OPPO 安第斯大模型的新卷法
而回溯语音助手的发展，也相当「高开低走」，2011年，iPhone 4S发布会上，Siri和iPhone一起亮相，风光无限，此后，语音助手迎来了它的辉煌发展时期。 OPPO大模型团队认为，有了大模型技术加持的智能助手，将给用户带来全新的智能体验。 2019年的4月，OPPO提出了万物互融的概念，在这以后，随着业务的不断拓展，安第斯智能云逐渐露出版图，2022年OPPO INNO DAY上，安第斯智能云正式发布，提供面向泛终端体系的智能云服务，当时刘海锋表示，OPPO大模型在模型的规格方面，希望做由不同规格组成的一系列大模型，既能够跟设备端更紧密的结合解决简单的任务，又可以部署在云端满足一些更复杂的需求。安第斯大模型基于端云协同架构构建。在SuperCLUE十大基础能力排行榜上，“知识与百科”能力AndesGPT测试得分高达98.33，大幅度领先其他大模型，仅次于GPT4排名国内第一。
72820编辑于 2023-10-27
标题：金融风控大模型在腾讯云的定制化支持与技术指南
摘要：本文旨在解析金融风控大模型技术能力，并提供基于腾讯云产品的定制化支持方案。文章将深入探讨技术核心价值、实施挑战、操作指南以及增强方案，并以结构化格式呈现，确保逻辑清晰、易于阅读。 3大关键挑战数据隐私与安全：在处理敏感金融数据时，如何确保数据安全和隐私保护是一大挑战。模型泛化能力：模型需要在不同的金融场景下保持高准确率，对模型的泛化能力提出了高要求。实时性要求：金融风控需要实时或近实时的风险评估，对模型的响应速度和处理能力是一大考验。操作指南实施流程数据准备与预处理原理说明：数据是金融风控大模型的基础，需要从多个数据源收集并预处理数据以供模型训练。在某银行客户实践中，通过腾讯云AI平台的定制化服务，成功将信用卡欺诈检测的准确率提高了20%。通过本文的技术指南，您可以深入了解金融风控大模型的定制化支持方案，并利用腾讯云产品实现技术落地。
54810编辑于 2025-07-29

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

训练开销骤减，10%成本定制专属类GPT-4多模态大模型

训练开销骤减，10%成本定制专属类GPT-4多模态大模型

VPGTrans: 10%的成本定制你自己的类GPT-4多模态大模型

大模型应用之（4）：Langchain架构与大模型接入

【大模型学习 | MINIGPT-4原理】

2024年企业软件定制开发必须了解的4大趋势

LLama4 原生多模态大模型

大模型恋爱神器！16种MBTI自由定制，北大ChatLaw团队出品

多模态大模型技术原理与实战(4)

NBT｜BioChatter：为生物医学量身定制的开源大语言模型应用平台

63_模型定制：领域微调技术

近期值得关注的4个时序大模型研究

OpenAI 将向企业开放 GPT-4o 模型定制版，国内怎么使用ChatGPT？

猛犸象大模型！MAmmoTH：目前最好的开源、通用数学大模型，现已超过GPT-4！

腾讯混元大模型·4月产品动态

大模型有关信息（2025年4月8日 - 4月14日）

VPGTrans：10% 的成本定制你自己的类 GPT-4 多模态对话模型

NUS、清华发布VPGTrans：轻松定制类GPT-4多模态大模型

为每个用户提供专属定制服务，OPPO 安第斯大模型的新卷法

标题：金融风控大模型在腾讯云的定制化支持与技术指南

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐