首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏AiCharm

    训练开销骤减,10%成本定制专属类GPT-4多模态模型

    本文来自新加坡国立大学和清华大学的研究者提出了一个名为 VPGTrans 框架,以极低成本训练高性能多模态模型。 多模态模型定制:通过我们的 VPGTrans 框架可以根据需求为各种新的语言模型灵活添加视觉模块。 开源多模态对话模型:我们开源了 VL-Vicuna,可实现高质量的多模态对话: 图 2:VL-Vicuna 的交互实例 一、动机介绍 1.1 背景 2023 年是 AI 元年,以 ChatGPT 为代表的语言模型 比如,LLM 在多模态理解领域掀起了一股从传统预训练视觉语言模型 (VLM) 到基于语言模型的视觉语言模型 (VL-LLM) 的变革。 b) TaS 场景下,越小的语言模型上训练的 VPG,迁移到模型时效率越高,最终效果越好。c) TaT 场景下,越小的模型之间迁移的 gap 越大。

    48320编辑于 2023-06-07
  • 来自专栏机器之心

    训练开销骤减,10%成本定制专属类GPT-4多模态模型

    ,比如 GPT-4、BLIP-2、Flamingo 等。 本文来自新加坡国立大学和清华大学的研究者提出了一个名为 VPGTrans 框架,以极低成本训练高性能多模态模型。 多模态模型定制:通过我们的 VPGTrans 框架可以根据需求为各种新的语言模型灵活添加视觉模块。 比如,LLM 在多模态理解领域掀起了一股从传统预训练视觉语言模型 (VLM) 到基于语言模型的视觉语言模型 (VL-LLM) 的变革。 b) TaS 场景下,越小的语言模型上训练的 VPG,迁移到模型时效率越高,最终效果越好。c) TaT 场景下,越小的模型之间迁移的 gap 越大。

    55920编辑于 2023-05-22
  • 来自专栏深度学习自然语言处理

    VPGTrans: 10%的成本定制你自己的类GPT-4多模态模型

    夕小瑶科技说 分享 作者 | 张傲 进NLP群—>加入NLP交流群 最近的多模态(对话)模型将基于文本的ChatGPT的强大能力扩展到了多模态输入,实现强大的多模态语义理解,比如GPT-4、BLIP 多模态模型定制 通过我们的VPGTrans框架可以根据需求为各种新的语言模型灵活添加视觉模块。比如我们在LLaMA-7B和Vicuna-7B基础上制作了VL-LLaMA和VL-Vicuna。 为代表的语言模型(LLM)大火。 比如,LLM在多模态理解领域掀起了一股从传统预训练视觉语言模型(VLM)到基于语言模型的视觉语言模型(VL-LLM)的变革。 b) TaS场景下,越小的语言模型上训练的VPG,迁移到模型时效率越高,最终效果越好。c) TaT场景下,越小的模型之间迁移的gap越大。

    38220编辑于 2023-08-22
  • 来自专栏后台技术汇

    模型应用之(4):Langchain架构与模型接入

    作为一个语言模型集成框架,LangChain 的用例与一般语言模型的用例有很大的重叠。 重叠范围包括文档分析和总结摘要, 代码分析和聊天机器人。 Langchain架构 LangChain工具 组件:模型包装器、聊天模型包装器、数据增强工具和接口链: 提供了标准接口,和数据平台和实际应用工具紧密集成 LangChain六模块 模块 核心作用 Agent作为高级模块,可调用其他所有模块功能 模型接入 接入示例 云服务和私有化模型优劣对比 维度 开发成本 算力成本 运维成本 数据安全 云厂商模型 较低,开箱即用 算力资源充足,模型性能好 &吞吐量较高 较低,提供云平台监控 安全性低 私有化模型 较高,自建模型网关、服务鉴权、可用性等 算力硬件投入成本高,模型性能较差低&吞吐量较低 较高,需要专业运维团队介入 安全性高,保密性强 小结: - 研发&测试环境:为了方便部署和测试,使用云服务 - 大客户生产环境:安全审核严格,大多数采用自建模型的方式 总结 LangChain 是什么?

    70810编辑于 2025-08-04
  • 来自专栏大模型成长之路

    模型学习 | MINIGPT-4原理】

    MINIGPT-4: ENHANCING VISION-LANGUAGE UNDERSTANDING WITH ADVANCED LARGE LANGUAGE MODELS在GPT4未开源的情况下,作者认为其表现优越是因为采用了最为先进的 LLM模型,因此,作者在BLIP2的基础上,将LLM模型替换为了Vicuna,同样也是通过一个线性映射层将图像表征映射为LLM的输入。 开源代码:https://minigpt-4.github.io/一、预训练方法预训练方法几乎和BLIP2模型一致,可以参考:【模型学习 | BLIP2原理】-腾讯云开发者社区-腾讯云1.1 Q-Former ; MINI-GPT4表现比BLIP2要强上许多? ① MiniGPT-4 使用的是 Vicuna(基于 LLaMA 的开源 ChatGPT 对话模型),具有更强的自然语言表达和指令理解能力;而BLIP-2 使用的 LLM 主要是 Flan-T5 或 OPT

    73910编辑于 2025-07-02
  • 来自专栏日常记录。。。

    2024年企业软件定制开发必须了解的4趋势

    因此,企业十分有必要了解最新的技术发展趋势,以确保定制的企业软件解决方案时刻保持最新状态,并且能够高效运行。 生成式人工智能模型可以用于预测市场动向和消费者行为,以帮助企业基于数据快速做出决策。AI驱动的计算机视觉技术可以自动追踪库存,并通过监测异常行为提升企业场所的安全性。 2、完整的服务流程上,飞算科技针对不同行业推出定制化服务,为客户提供高质量、高效率及高满意度的定制化合作以及无忧的售后运维服务,协助客户共同验证和完善企业商业模式的体系。 以近期飞算科技为天禹数智定制化开发的全链路智能拓客系统—“销管家”为例,可以实现“全域获客”、“一键分销”、“私域激活”、“数据追踪”、“直播变现”及“业务管理”六功能。 截至目前已为包括医疗、金融、制造、零售等在内的八行业的上百家机构提供了技术服务,加速其数字化转型进程。

    59810编辑于 2023-11-22
  • 来自专栏算法一只狗

    LLama4 原生多模态模型

    Meta最新发布了原生多模态模型 Llama 4,一经亮相即登上LMSYS模型排行榜第二名,仅次于Google的Gemini-2.5-pro,分差仅为22分,实力可见一斑。 在模型规模方面,Llama 4系列的确非常庞大,尤其是Behemoth模型,远超业内主流,例如DeepSeek R1参数量仅为6710亿,只有Behemoth的约三分之一。 当前行业趋势多偏向小而高效的模型,Llama 4如此庞大的规模实属少见。 总结与展望Llama 4的发布,意味着Meta正式进入原生多模态模型竞争核心领域。 相比Gemini系列、GPT-4o、Claude 3、DeepSeek等主流模型,Llama 4以务实高效的技术路线,突出计算成本、推理效率与多模态能力的平衡。

    77500编辑于 2025-05-01
  • 来自专栏量子位

    模型恋爱神器!16种MBTI自由定制,北大ChatLaw团队出品

    Jiaxi 投稿自 凹非寺 量子位 | 公众号 QbitAI 北大团队新作,让模型拥有个性! 而且还是自定义那种,16种MBTI都能选。 这样一来,即便是同一个模型,不同性格下的回答都不一样。 ENFP的模型会说:喜欢参加社交活动,结识新朋友。 INFJ的模型则回答:喜欢独自读过。 这样能干啥呢?北大的童鞋们列出来了一些情景 : 在特殊节日,给你的男/女朋友寻找心仪的礼物。 深入理解模型定制化、个性化的方式及可能性。 在做出重大决策时,考虑不同情境下的个性特征。 通过深入了解人性的复杂性,促进个人成长和相互理解。 行为数据集的目的是为了让模型可以表现出不同性格的回应,这部分是对Alpaca数据集进行个性化修改实现。 行为数据集中MBTI四个维度的比例如下: 自我意识数据集是为了让模型能够意识到自己的个性特征。 通过一个两阶段的有监督训练微调过程,最后可以得到对应人格的模型

    98010编辑于 2024-01-17
  • 来自专栏啄木鸟软件测试

    多模态模型技术原理与实战(4)

    多模态模型核心技术 1多模态的困难 困难 数据集标志困难 人工标注生成 COCO Visual Genome ... OpenAl的DALL-E2和GPT4 谷歌大脑的 lmaen和Stable Diffusion 百度的文心一言 文本生成图像 基于GAN的文本生成图像方法 AlignDRAW:第一个现代文本生成图像模型 图像解码器 把隐信息还原成图像 4语音多模态技术 文本生成语音 以前技术:拼接法和参数法 基于非深度学习的文本生成语音技术 隐马尔可夫模型 (HMM) 文本信息提取模块 声学特征提取模块 可调整的低秩适配(Adaptive Low-Rank Adaptation,AdaLoRA)技术和量化压缩远程注意力(Quantized Long-Range Attention,QLoRA)技术 8 GPT-4模型核心技术介绍 Transformer:编码器-解码器框架 编码器:衍生出了自编码模型,如BERT、RoBERT和ALBERT 解码器:衍生出了自回归模型,如GPT-1和GPT-2 整体衍生出:T5和GLM

    46210编辑于 2024-09-10
  • 来自专栏实验盒

    NBT|BioChatter:为生物医学量身定制的开源语言模型应用平台

    引言 近年来,生成式人工智能尤其是语言模型(LLM)取得了显著进展,但在生物医学研究中的应用仍处于起步阶段。 BioChatter是一个开源的Python框架,旨在遵循开放科学原则,开发定制的生物医学研究软件。 它还促进了在简单性/经济性与安全性之间的定制部署,用户可以根据自己的需求在公共数据库、自托管云数据库和本地数据库之间进行选择,平衡安全性与成本。 系统提示与多智能体系统 BioChatter的可定制平台允许用户通过系统提示将其与自己的上下文对齐,并使用基于智能体的系统进行高级工作流程。 基准测试框架在所有模型和相关参数上运行这些测试,并通过BioChatter网站向社区报告结果。

    49510编辑于 2025-02-05
  • 来自专栏AI SPPECH

    63_模型定制:领域微调技术

    引言:为什么需要模型定制与微调 ├── 2. 微调技术体系:从全参数到参数高效 ├── 3. 全参数微调:深度定制的经典路径 ├── 4. 参数高效微调:资源受限下的优化选择 ├── 5. 引言:为什么需要模型定制与微调 在2025年的AI生态系统中,通用语言模型(LLM)如ChatGPT、LLaMA 4、Claude 4等已经展现出惊人的通用能力。 然而,当面对特定行业或场景的专业需求时,通用模型往往表现出局限性:术语理解不准确、领域知识不足、任务适配性差等问题。这正是模型定制与微调技术应运而生的背景。 全参数微调:深度定制的经典路径 全参数微调(Full Fine-tuning)是最传统的微调方法,通过更新预训练模型的所有参数来适应特定任务。 通过科学的数据工程、合理的技术选型和系统的评估优化,任何团队都可以构建出高性能、专业化的定制模型

    38710编辑于 2025-11-16
  • 来自专栏科学最Top

    近期值得关注的4个时序模型研究

    前言 梳理了近期几篇时间序列模型研究文章(后台回复:“论文合集”获取),时间序列模型的研究正在迅速发展,并且在多个领域和应用中展现出巨大的潜力。 随着技术的不断进步,预计未来会有更多创新的方法和应用出现,但我感觉目前可以重点关注以下三方面: 基础模型的构建:研究者们正在尝试构建时间序列预测的基础模型,这些模型可以在不同的时间序列数据集上进行预训练 特定领域的应用:模型正在被应用于特定领域的时间序列预测,如金融、医疗、交通等,以解决特定问题并提供可解释的预测。 4、Lag-Llama 论文标题:Lag-Llama: Towards Foundation Models for Probabilistic Time Series Forecasting 在过去的几年中 Lag-Llama作为时间序列预测领域现有技术的强大竞争者,并为未来针对时间序列数据定制的基础模型的进展铺平了道路。

    1.7K10编辑于 2024-09-18
  • 来自专栏拥抱GPT

    OpenAI 将向企业开放 GPT-4o 模型定制版,国内怎么使用ChatGPT?

    OpenAI 最近发布了一项新功能,使企业客户可以通过微调技术定制 GPT-4o 模型,从而应对日益激烈的人工智能竞争,并展示其投资回报。 这一新功能的推出使得企业能够使用自己的数据对 GPT-4o 模型进行个性化调整,以满足他们的特定需求和业务场景。 与此前不同,GPT-4o 的企业客户现在可以对模型进行细化训练,而这在之前的版本中是不可实现的。这一新功能特别适用于需要在特定领域进行高效应用的企业。 举例来说,一家生产滑板的公司可以微调 GPT-4o 模型,使其成为客户服务聊天机器人,能够解决客户关于滑板轮子、护理方法等非常具体的需求。 通过定制 GPT-4o 模型,企业不仅可以提升自身竞争力,还能够在为客户提供个性化解决方案的同时,优化内部工作流程。这项新功能无疑将成为企业推进人工智能战略的重要工具。

    30620编辑于 2024-08-21
  • 来自专栏自然语言处理(NLP)论文速递

    猛犸象模型!MAmmoTH:目前最好的开源、通用数学模型,现已超过GPT-4

    引言  大型语言模型 (LLM)的数学推理能力是评估模型能力的一项关键指标。 尽管目前很多大型语言模型(LLMs)在该领域取得了一定的进展,但与闭源的模型相比,开源模型的数学推理能力仍然有很大差距。   (LLM)的数学推理能力是评估模型能力的一项关键指标。 尽管该领域取得了一定的进展,但是开源模型和闭源模型之间仍然存在明显的差距。 目前一些比较流行的闭源LLM主要包括:GPT-4、PaLM-2、 Claude2,它们在主流的GSM8K、MATH数据集上面占据着了主导地位;而Llama、Falcon、OPT等开源模型在所有基准上都大幅落后

    1.7K20编辑于 2023-09-21
  • 来自专栏【腾讯云开发者】

    腾讯混元模型·4月产品动态

    作为腾讯全链路自研的模型,自2023年9月公开亮相以来,腾讯混元模型共经历了数十次迭代,支持内部超过400个业务和场景接入,并通过腾讯云面向企业和个人开发者全面开放(API个人权益与企业客户一致,已实名腾讯云账号提供累计

    56340编辑于 2024-04-28
  • 来自专栏AI分享

    模型有关信息(2025年4月8日 - 4月14日)

    Meta发布Llama 4模型引发争议发布情况:4月13日,Meta平台公司推出了Llama语言模型新一代版本——Llama 4 Scout和Llama 4 Maverick。 专业评估机构LMArena把Llama 4 Maverick的某个版本评为当下性能最强的开源语言模型,但开发者亲自测试发现,通过不同方式访问时效果差异巨大,Meta高管也承认其表现“参差不齐”“质量不稳定 独特优势:Llama 4拥有超大的上下文窗口,一次能处理1000万个token,大约相当于800万个单词,相比OpenAI的GPT-4的上下文窗口优势明显。 嘀嗒出行公布模型应用于客服的进展应用成果:4月14日,嘀嗒出行公布其AI模型在客服领域的应用进展。基于模型的智能判责准确率已超过80%,智能工单生成效率提升50%,准确率达98%。 小鹏汽车训练物理模型何小鹏表态:4月14日,小鹏汽车创始人何小鹏在社交平台发帖称,小鹏坚持全栈自研,去年率先在自动驾驶领域引入强化学习、模型蒸馏的路线,并且训练了一个超大规模的物理世界模型,国内还没有第二家车企可以做到

    3.5K20编辑于 2025-04-15
  • 来自专栏AI科技评论

    VPGTrans:10% 的成本定制你自己的类 GPT-4 多模态对话模型

    最近的多模态(对话)模型将基于文本的ChatGPT的强大能力扩展到了多模态输入,实现强大的多模态语义理解,比如最近的GPT4、BLIP-2、Flamingo等。 多模态模型定制: 通过我们的VPGTrans框架可以根据需求为各种新的语言模型灵活添加视觉模块。比如我们在LLaMA-7B和Vicuna-7B基础上制作了VL-LLaMA和VL-Vicuna。 为代表的语言模型(LLM)大火。 比如,LLM在多模态理解领域掀起了一股从传统预训练视觉语言模型(VLM)到基于语言模型的视觉语言模型(VL-LLM)的变革。 4 定制您的VL-LLMs 我们的VPGTrans可以快速为任意新的LLMs添加视觉感知模块,从而得到一个全新的高质量VL-LLM。

    73320编辑于 2023-05-12
  • 来自专栏新智元

    NUS、清华发布VPGTrans:轻松定制类GPT-4多模态模型

    ---- 新智元报道   编辑:LRS 好困 【新智元导读】最近的多模态(对话)模型将基于文本的ChatGPT的强大能力扩展到了多模态输入,实现强大的多模态语义理解,比如GPT-4、BLIP-2 今年是AI技术爆发式发展的一年,以ChatGPT为代表的语言模型(LLM)大火。 多模态模型定制: 通过我们的VPGTrans框架可以根据需求为各种新的语言模型灵活添加视觉模块。比如我们在LLaMA-7B和Vicuna-7B基础上制作了VL-LLaMA和VL-Vicuna。 (VLM)到基于语言模型的视觉语言模型(VL-LLM)的变革。 b) TaS场景下,越小的语言模型上训练的VPG,迁移到模型时效率越高,最终效果越好。 c) TaT场景下,越小的模型之间迁移的gap越大。

    52250编辑于 2023-05-22
  • 来自专栏AI科技评论

    为每个用户提供专属定制服务,OPPO 安第斯模型的新卷法

    而回溯语音助手的发展,也相当「高开低走」,2011年,iPhone 4S发布会上,Siri和iPhone一起亮相,风光无限,此后,语音助手迎来了它的辉煌发展时期。 OPPO模型团队认为,有了模型技术加持的智能助手,将给用户带来全新的智能体验。 2019年的4月,OPPO提出了万物互融的概念,在这以后,随着业务的不断拓展,安第斯智能云逐渐露出版图,2022年OPPO INNO DAY上,安第斯智能云正式发布,提供面向泛终端体系的智能云服务,当时 刘海锋表示,OPPO模型模型的规格方面,希望做由不同规格组成的一系列模型,既能够跟设备端更紧密的结合解决简单的任务,又可以部署在云端满足一些更复杂的需求。 安第斯模型基于端云协同架构构建。 在SuperCLUE十基础能力排行榜上,“知识与百科”能力AndesGPT测试得分高达98.33,大幅度领先其他模型,仅次于GPT4排名国内第一。

    72820编辑于 2023-10-27
  • 标题:金融风控模型在腾讯云的定制化支持与技术指南

    摘要: 本文旨在解析金融风控模型技术能力,并提供基于腾讯云产品的定制化支持方案。文章将深入探讨技术核心价值、实施挑战、操作指南以及增强方案,并以结构化格式呈现,确保逻辑清晰、易于阅读。 3关键挑战 数据隐私与安全:在处理敏感金融数据时,如何确保数据安全和隐私保护是一挑战。 模型泛化能力:模型需要在不同的金融场景下保持高准确率,对模型的泛化能力提出了高要求。 实时性要求:金融风控需要实时或近实时的风险评估,对模型的响应速度和处理能力是一考验。 操作指南 实施流程 数据准备与预处理 原理说明:数据是金融风控模型的基础,需要从多个数据源收集并预处理数据以供模型训练。 在某银行客户实践中,通过腾讯云AI平台的定制化服务,成功将信用卡欺诈检测的准确率提高了20%。 通过本文的技术指南,您可以深入了解金融风控模型定制化支持方案,并利用腾讯云产品实现技术落地。

    54810编辑于 2025-07-29
领券