首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏AI专栏

    AI模型落地实践与思考

    (开玩笑)本文探讨一下AI给当下业务能够带来哪些流程化工程化的价值AI落地模型分类虽然模型种类有很多,但是在笔者看来主要的逻辑经验为以下两类:模型训练与RAG+AI处理模型训练核心:将某一个重复性动作 AI遵守什么样的流程规范经典案例:针对于模型训练,公司内已经有很多主流的落地实践经验1) 腾讯会议小助手:功能定位:高效总结会议纪要,回答会议内问题这里我们可以发现,它针对于用户输入问题,能够给出非常简要的回答 , "output": "晋江南音演唱节"}总结分析以上简单分析了两个AI模型落地的经验,总结看来,如果要将模型训练落地到业务,首先要明确几个要点:1、完成动作:是否为重复性的简单行为,例如文段提取,文本校验等等 AI能力边界,实现方法很简单粗暴,再做一个AI助手而AI的发展脉络,笔者认为是这样的:AI只能给一个问题答案 → AI能够回答一类问题 → AI能够回答所有问题 → AI助手落地某一个应用 → AI团队互相协作 ,但是一定要会用AI,从提升自己的编码效率,到落地应用给业务赋能等,一定要通过AI提升自己的核心竞争力对于产品人员:提升应用AI的敏锐洞察力,我见过很多AI落地的经验,例如百果园落地AI,实现AI销冠:

    70310编辑于 2025-08-26
  • 来自专栏个推技术实践

    AI模型迈入应用时代,每日互动推动“可控模型落地

    ChatGPT的推出引爆了一场波及全球科技领域的“AI飓风”,越来越多的企业入局模型赛道,推动AI全面迈进应用时代。 通过与行业知识结合,模型能从海量的数据中提取出有价值的信息,为业务决策提供智能支持,但现阶段模型缺乏对价值观的判断。在实际的业务场景中,垂直行业更需要“可控模型”。 面对模型热度的持续狂飙,很多企业跃跃欲试,希望在发展和应用模型的道路上抢占先机。 然而在实际落地模型的过程中,企业发现目前的模型多是通用模型(GLM),这些通用模型未经过相应专业领域知识的系统性训练和学习,无法很好地满足垂直领域的专业需求;而如果考虑结合所在行业的细分需求、专业 每日互动正是基于DMP的闭环路径开展可控模型的行业落地实践,把模型“大脑”的能力输出给各行各业使用,并结合行业客户的应用反馈持续进行模型的训练迭代。

    73820编辑于 2023-06-20
  • AI模型算法-从模型原理剖析到训练(微调)落地实战

    这些模型不仅能够理解和生成高质量的自然语言文本,还能适应多种下游任务,极大地推动了AI技术的落地应用。然而,模型的训练和微调涉及复杂的算法、庞大的计算资源和精细的优化策略。 本文将从模型的基本原理出发,深入剖析其核心算法,并探讨如何在实际业务中进行训练和微调,最终实现AI模型落地应用。2. 模型落地挑战与解决方案4.1 计算资源限制模型的推理成本高昂,解决方法包括:模型量化(Quantization):将FP32模型转换为INT8或INT4,减少计算开销。 未来展望随着AI技术的演进,模型的发展趋势包括:多模态模型(如GPT-4V、PaLM-E)融合文本、图像、视频等多种模态。更高效的训练方法(如MoE架构、稀疏训练)降低计算成本。 AI民主化:开源社区(如LLaMA、Falcon)推动模型普及。6. 结论AI模型正在重塑人工智能的应用范式,从原理到落地涉及算法、数据、计算资源等多方面挑战。

    2.5K20编辑于 2025-07-07
  • AI模型算法-从模型原理剖析到训练(微调)落地实战

    AI模型算法:从原理剖析到训练微调落地实战全景指南我们正站在一个历史性的拐点上。以ChatGPT、GPT-4、Llama、文心一言等为代表的AI模型,正以前所未有的力量重塑各行各业。 然而,对于大多数企业和开发者而言,从头开始训练一个千亿级参数的模型是遥不可及的。真正的价值在于——如何深入理解其原理,并掌握对现有模型进行定制化训练(微调)的能力,让其为我所用,解决实际业务问题。 一、 核心概念:什么是模型?为什么需要微调?模型:通常指基于“Transformer”架构、在海量多源数据上训练而成的、参数规模达到数十亿乃至数千亿的深度学习模型。 四、 落地实战篇:手把手构建你的第一个行业大模型理论最终需要付诸实践。一个典型的微调落地流程如下:第一步:明确任务与数据准备定义任务:是要做文本分类、问答、对话生成还是代码补全? 现在,就从选择一个开源模型(如Llama 2-7B)和一个具体的任务(如构建一个IT运维知识问答机器人)开始你的模型实战之旅吧!

    1.1K11编辑于 2025-08-28
  • 来自专栏AI科技评论

    模型「进化手册」:AI 原生应用该如何落地

    从开发、产品落地到商业化,企业需要的服务在百度智能云里闭环了。 作者 | 黄 楠 编辑 | 陈彩娴 狂奔两百多天后,模型战役进入了第二幕。 据 AI 科技评论观察,模型应用的落地有两堵围墙: 其一,许多企业虽然希望借助 AI 原生应用来解决过往业务中的难题,但由于信息的快速迭代和交互壁垒,他们并没有很好的路径得以了解、触达到已经诞生的模型应用 其二,对于缺少技术培训赋能、资本及产业落地支持的初创企业,百度智能云推出了 AI 加速器。 更重要的是,面向客户落地模型的五类需求,百度智能云基于千帆模型平台打造的“模型超级工厂”给出包括AI原生应用开发平台在内的全套服务方案。 同时推出模型全链路生态支持体系,加速企业 AI 原生应用落地和商业化。 接下来的竞赛,不再是局限于模型的追逐,更是如何对应用产品进行自我优化、革新。

    77920编辑于 2023-10-24
  • 来自专栏AI科技评论

    模型「进化手册」:AI 原生应用该如何落地

    从开发、产品落地到商业化,企业需要的服务在百度智能云里闭环了。 作者 | 黄 楠 编辑 | 陈彩娴 狂奔两百多天后,模型战役进入了第二幕。 据 AI 科技评论观察,模型应用的落地有两堵围墙: 其一,许多企业虽然希望借助 AI 原生应用来解决过往业务中的难题,但由于信息的快速迭代和交互壁垒,他们并没有很好的路径得以了解、触达到已经诞生的模型应用 其二,对于缺少技术培训赋能、资本及产业落地支持的初创企业,百度智能云推出了 AI 加速器。 更重要的是,面向客户落地模型的五类需求,百度智能云基于千帆模型平台打造的“模型超级工厂”给出包括AI原生应用开发平台在内的全套服务方案。 同时推出模型全链路生态支持体系,加速企业 AI 原生应用落地和商业化。 接下来的竞赛,不再是局限于模型的追逐,更是如何对应用产品进行自我优化、革新。

    42630编辑于 2023-10-24
  • 来自专栏深度学习|机器学习|歌声合成|语音合成

    java落地AI模型案例分享:xgboost模型java落地

    xgboost模型java落地 1. 看到这里可能有些读者会头晕了,这么多公式,我在这里只做一个简要式的讲解,具体的算法细节和公式求解请查看这篇博文,讲得很仔细:通俗理解kaggle比赛杀器xgboost XGBoost的核心算法思想不难 GBDT在模型训练时只使用了代价函数的一阶导数信息,XGBoost对代 价函数进行二阶泰勒展开,可以同时使用一阶和二阶导数。 input_data) output = load_and_run_onnx_model(model_path, input_data) print(output) 6. java推理 import ai.onnxruntime java推理onnx模型

    1.7K10编辑于 2024-10-01
  • 来自专栏服务端技术杂谈

    如何实现模型后训练帮助AI在企业落地

    当前产业共识是,模型后训练不再是简单的模型优化,而是AI落地的必经之路。 企业需要将通用基座模型,训练成深度理解自身业务、具备领域知识、能执行复杂策略的智能引擎。 首先通过模型自动过滤掉不合规、回答错误的数据,然后利用模型自动校正文本中的错别字、口语化、重复的表达,大幅减轻人工校对的成本。 再对人工话术进行润色和优化,提升话术质量。 2、Model:选择合适的基座模型,降低工程门槛; 比如选择千问模型,其尺寸广泛满足不同场景对于成本和性能的需求。 再用海量高质量数据对千问模型进行预训练,使其具备强大的内容理解能力。 最后,蒸馏到一个更轻量级的模型上。 这样既获得了模型的效果,又可以更低的成本实现业务效果。 AI在企业中的落地,来自于如何用好企业独有的场景、数据和业务的理解。

    22210编辑于 2026-03-11
  • 2026模型备案落地指南

    模型登记:纯API调用型AI应用核心技术特征:项目全程不触碰模型权重、不进行模型训练与微调、不修改底层算法架构。 技术落地优势:无需投入人力编写模型算法评估报告、数据集合规说明等专业文档,无国家级技术复审环节,无需改造模型底层,开发与合规成本最低,是轻量化AI应用的主流合规方案。 模型备案:自研/二次改造型AI应用核心技术特征:只要对模型进行底层改造,均需走备案流程。 适配开发场景:行业定制专属模型、私有化部署AI系统、企业专属微调模型、具备模型迭代优化能力的AI平台级产品。 、数据集说明、算法安全评估报告审核核心重点接口调用合规性、应用层风控落地有效性模型算法安全性、训练数据合规性、迭代安全机制整体落地周期3-4个月,适配快速上线需求6-8个月,适配深度定制项目模型登记:

    40210编辑于 2026-05-22
  • 来自专栏机器之心

    模型进入「落地战」,腾讯云下手「行业」模型

    正如每项落地AI 技术一样,作为使用者,企业首先清楚自身行业需求,然后将这些需求转化为模型解决的课题,这其中不能一概而论,也是模型最终能否为企业带来效益的先决条件。 一站式 MaaS 服务 为企业减负 在利用 AI 技术的方式上,我们经历了多轮迭代。过去几个月,模型即服务(MaaS)的概念成为主流,被认为是加速实现模型技术及 AI 应用落地产业的重要途径。 模型进入「落地战」 自 ChatGPT 发布的这段时间以来,模型成为了绕不过去的话题,很多厂商都在发力,希望训练出一个类似 ChatGPT 的通用 AI。 腾讯云,背靠腾讯优图实验室、腾讯 AI Lab 等顶级实验室的产品和技术能力,加上自身多年产业实践经验,提供了从底层算力、算法开发、AI 应用到全场景数智化的四级全链条服务,全力推动行业大模型落地。 此外,我们了解到,面向更广泛、更多样化的产业落地需求,腾讯云未来将继续依托算力算法创新、更弹性的算力部署、更深入的场景融合、更开放的 AI 生态,让包括模型在内的 AI 变得「唾手可得」,把行业的实际需求作为技术发展的驱动力

    1.5K40编辑于 2023-08-07
  • 来自专栏澜舟科技 NLP

    模型落地实践:同花顺模型技术应用及优化

    文内从业务角度介绍了模型技术在同花顺业务上的应用以及未来探索的方向。众所周知,模型参数量大,通用能力强,综合性能好。 但在同花顺业务场景中最初使用模型的时候,发现用模型的效果与传统方法差距不大,甚至有时候逊于原先传统的方法。 所以最初在业务角度并不够重视,然而近期随着模型技术的快速发展,我们也在逐步尝试将模型在业务中落地,目前模型在自然语言处理相关的业务里都取得了比传统模型更优的效果,下面详细介绍相关工作。 确实在我们的业务模型里,规则占比非常,也是因为涉及用户财产问题,技术上会比较保守。下面具体介绍问答系统里模型应用的经验和取得的成果。 目前通用语义识别方面模型的效果已经慢慢显现了。

    3.1K20编辑于 2022-08-11
  • 2026 AI 元年:模型到智能体的技术落地革命

    摘要2026年被公认为AI元年,核心标志是AI发展重心从模型的理论探索转向智能体的规模化落地。 目录一、序章:2026AI元年的核心标志——从模型到智能体的跃迁二、技术演进:模型到智能体的四核心能力突破三、产业落地:智能体赋能多行业的转型实践四、革命内核:从模型到智能体的三落地逻辑变革五 、挑战与破局:规模化落地的核心路径六、未来趋势:2026年后智能体发展方向七、结语八、FAQ九、参考文献一、序章:2026AI元年的核心标志——从模型到智能体的跃迁2026年,AI产业正式迈入“元年” 安全化​:强化数据安全、模型安全技术防护,完善伦理规范与监管体系,保障健康发展。七、结语2026AI元年的智能体落地革命,是模型技术沉淀的必然结果,实现了AI从“理解”到“行动”的关键跨越。 因这一跃迁实现AI从被动辅助到主动行动的质变,让AI真正融入产业全流程,重构应用逻辑并推动全域普及,是AI进入规模化落地阶段的核心特征。2.智能体与模型的核心区别是什么?

    4.7K10编辑于 2026-01-29
  • 来自专栏科技云报道

    模型进化论:AI产业落地将卷向何方?

    回顾2024年模型产业发展,我们看到了一条逐渐清晰的演进路径:低成本降低了模型落地的门槛;AI Agent提供了模型绝佳的应用方式;多模态直接拓宽了模型的能力边界,这一切都为模型产业落地按下了加速键 如果说“成本、AI Agent、多模态”三个关键词,代表着2024年模型的进化方向,那么它们也代表着模型迈向产业落地的关键节点。 随着新一年的到来,这一发展趋势是否会在2025年延续下去? 模型产业落地又将卷向何方? 成本 打通模型落地的卡点 过去一年,模型来到了更务实的落地阶段,但落地始终绕不过一个卡点——成本。 AI Agent 模型应用的场景化突破 伴随AI产业竞争进入“落地赛”的下半场,业界将目光从模型本身投向了AI应用。 展望2025年多模态模型的发展趋势,或许可以用一句话来总结:离幻觉更远,离落地更近。 AI落地 从产业到行业 过去一年的激荡,让人们充分感受到,2024年是模型改变世界的一年。

    30400编辑于 2025-03-04
  • 来自专栏深度学习与python

    企业落地 AI 模型,一个 DeepSeek 远远不够

    这一优势对中小企业尤其友好,能够加速 AI 模型在企业应用场景中的落地模型思考,深度如人:R1 模型是一个深度思考模型,不仅提供问题的答案,还展示了推理过程,类似于数学题的解题步骤。 最终目标是让模型在企业应用场景中落地,帮助企业实现增收降本和提升办公效率。 客户需求和市场需求的变化正在深刻地引导整个 AI 市场格局的演变,尤其是 ToB(企业服务)领域。 这种模型的通用能力与小模型的专业能力相结合,将有力推动企业 AI落地应用。 这些行业对 AI 技术的需求,市场空间广阔,但同时也面临着较高的开发成本和门槛。通过我们提到的技术落地方案,如模型微调、数据蒸馏等,结合平台工程能力,可以大幅降低开发门槛,释放行业潜力。 InfoQ:神州数码是否有已经落地的金融模型相关应用,或者在这一领域有什么研究方向? 谢国斌: 在金融领域,我们已经有了一些模型的应用案例。

    53710编辑于 2025-03-03
  • LLMOps:模型落地的关键推手

    当很多大型的模型从实验室之中走了出来。以往仅仅只是出现在论文以及演示当中的语言模型(LLM),当下正在迅速地进入到企业真实的业务场景之中。但是仅仅只有模型可不行。 LLMOps,即大型语言模型之操作也。其乃针对语言模型之运维与管理实践者也。其非独将技术简单堆叠而已,实乃一套使人工智能从可用到好用且可靠运用之工程方法也。 在过去的这一年里,企业对于模型的热情已经从去尝试一些新鲜的事物转变成为了去进行深入的钻研。 LLMOps的本质从根本上来说并不是去对AI进行控制,反而是给人类赋予能力。它使得开发者不再如同救火队员一般地忙碌,而是可以变为设计师。它让用户不再仅仅只是被动地接受,而是能够主动地参与其中。 这是因为在人工智能落地的漫长路途当中,起跑的时候快比不上稳稳地去奔跑,而LLMOps就是那可以信赖的跑鞋。

    15010编辑于 2026-03-31
  • 来自专栏小洁叫你mysql

    AI模型】训练Al模型

    模型超越AI 目前所指的模型,是“大规模深度学习模型”的简称,指具有大量参数和复杂结构的机器学习模型,可以处理大规模的数据和复杂的问题,多应用于自然语言处理、计算机视觉、语音识别等领域。 本文将探讨模型的概念、训练技术和应用领域,以及与模型相关的挑战和未来发展方向。 模型是指具有庞大参数数量的机器学习模型。传统的机器学习模型通常只有几百或几千个参数,而模型则可能拥有数亿或数十亿个参数。 训练模型的挑战 训练模型需要应对一系列挑战,包括: 以下是与模型相关的一些代码示例: 计算资源需求: import tensorflow as tf # 指定使用GPU进行训练 with tf.device 更智能的模型压缩技术:模型压缩和加速技术将继续发展,以减小模型的计算和存储开销。 更好的计算平台支持:为了支持训练和部署模型,计算平台将继续改进,提供更强大的计算资源和工具。

    1.6K30编辑于 2023-10-10
  • Java 企业 AI 开发核心:模型统一接入与高效落地

    在人工智能技术深度渗透各行业的当下,Java作为企业级应用开发的主流技术栈,自然成为承载AI能力落地的核心载体。 面向Java生态的企业级AI应用开发框架JBoltAI,恰好提供了这样的统一处理能力,其深度整合了20+主流AI模型平台,兼容OpenAI、文心一言等公共模型及私有化部署模型,通过标准化的接口封装, Java团队在接入模型后,需结合业务场景进行能力落地:通过提示词工程实现文案生成、代码编写等基础应用;借助私有知识库(RAG)提升行业专属知识的精准匹配与生成能力;针对现有系统进行模块改造,让AI智能调用系统暴露的接口 四、兼顾灵活扩展,适配未来演进AI技术与模型生态处于持续发展中,新的模型、新的能力不断涌现。Java企业的AI架构设计需具备前瞻性,支持模型的灵活扩展与能力升级。 JBoltAI作为深耕Java生态的企业级AI应用开发框架,从统一模型接入到全流程开发支撑,从团队能力建设到业务价值落地,为Java企业提供了契合生态特性的一站式解决方案。

    27410编辑于 2026-01-20
  • 来自专栏量子位

    AI模型时代 ≠ 只有模型AI时代

    从这个规律来看,语言模型(简称LLM)出现后虽然霸占了所有与AI相关的关键词,吸引了所有人的注意力,但这并不代表“LLM之前无AI”。 所以,AI不是只有模型AI模型时代也 ≠ 只有模型AI时代。 成熟的AI,早就已经上岗了 或许你还不敢相信,现在哪怕小小的快递背后,都已经有AI技术在加持了。 除了核心硬件平台外,实际情况中帮助这些行业实战AI应用落地的,还有一系列英特尔“亲生”但不“私享”的AI软件工具。 虽然相比那些成熟的AI技术和应用,它距大规模落地还有段距离,但其技术领先性不容置疑,乃至“老一辈”的AI应用也有望在与它结合,或被它改造后重焕新生。 更多《英特尔平台上的行业AI实战与模型优化》相关内容,可扫描下方海报中的二维码获取。点击原文链接,阅读英特尔《最“in”模型》专栏的所有文章。 — 完 —

    75010编辑于 2023-09-27
  • 来自专栏NewBeeNLP

    业界分享 | NVIDIA语言模型落地实践

    NeMo Framework 是 NVIDIA 语言模型的全栈解决方案,它通过不同组件完成生成式 AI 各个环节的任务,包括数据预处理、分布式训练、模型微调、模型推理加速及部署(TensorRT-LLM 随着进入 AI 2.0 语言模型时代,NVIDIA 隆重推出了 TensorRT-LLM。在 TensorRT 的基础上,TensorRT-LLM 对 LLM 部分进行了相应的封装和增强。 生成式AI 不仅仅局限于语言模型,还涵盖了与深度神经网络相关的部分以及更广泛的内容。 涉及知识库、向量库以及 Agent,与模型的最终落地息息相关。 第六,Guardrails,主要充当守门员的角色。对于一些常见的问题,比如对时政等问题首先进行过滤。 第五步,将这些 chunk 作为输入,与 prompt 一起传递给语言模型,得到更加精准且匹配的反馈和回答。 这样语言模型就能够真正实现落地,更贴近于当前的使用场景。

    95210编辑于 2024-03-25
  • 场景化拆解 AI 模型落地的 6 核心考量》

    从训练好的模型文件到稳定可用的业务服务,部署环节直接决定 AI 技术的落地效果 —— 既能让模型在电商促中支撑万级 QPS,也可能因一次冷启动延迟错失用户。 本文结合行业实践与腾讯云本地化部署经验,拆解模型部署必须攻克的六关键因素。 搜一下微信公粽号:AI模型API聚合-向量引擎 一、需求锚定:以业务目标定义部署边界 部署的核心是 “适配需求” 而非 “追求技术完美”,需先明确三基础问题: 性能约束:实时对话需响应延迟<500ms 结语:部署的本质是 “价值工程” AI 模型部署的核心不是堆砌技术,而是在性能、成本、合规、体验间找到最优解。 腾讯云通过模型优化工具链、多架构部署选项、智能监控体系,已帮助金融、医疗、电商等行业客户实现 “推理效率提升 300%+,TCO 降低 50%+” 的落地效果。

    60710编辑于 2025-09-24
领券