首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏RTSP服务器

    AI时代底层技术链:GPU、原生模型协同进化全解析

    模型训练一次要烧掉上亿人民币? 计算巨头都在抢「算力调度业务」? 各国发布「AI 国家战略」? 看新闻仿佛置身一场术语混战: AI、模型、GPU、原生,到底在说啥? 是彼此替代? 高效烹饪体系算力底座餐厅管理与食材供应系统原生(Cloud Native)流程调度算力管理基础设施一句话总纲: GPU 提供算力 → 原生调度算力 → 模型实现智能 → 人工智能走向真实世界价值落地 技术链路全景图用一句最清晰的话总结: 想要 AI 改变世界 → 需要模型 想要模型跑起来 → 需要海量 GPU 想要 GPU 集群不崩溃且不烧钱 → 需要原生 形成如下技术金字塔结构:它们不是并列概念 因为每一层都体现国家竞争力与产业控制力:层级决定因素产业战略价值GPU制造能力、供应链、安全可控卡脖子最严重、最稀缺资源原生算力调度能力、规模管理算力是否可成为基础设施模型算法积累与数据规模通用智能竞争壁垒 AI 应用行业落地与生态真实生产力转化一句话: 谁掌握 GPU、原生模型,谁就能定义 AI 的未来 结语:时代的底层规律当我们仰望人工智能的璀璨时,别忘了它脚下的地基: GPU 承担算力之力 原生

    71010编辑于 2025-12-08
  • 来自专栏科技云报道

    原生模型“降本增效”的解药吗?

    那么,原生是如何帮助模型降本增效,在这个过程中又遇到了哪些挑战? 原生成为模型的标配 近年来,容器和Kubernetes已经成为越来越多AI应用首选的运行环境和平台。 随着模型浪潮的到来,以原生环境运行AI应用正在变成一种事实标准。 弹性伸缩与资源管理 模型训练往往需要大量的计算资源,而原生环境通过容器化和编排工具可以实现资源的弹性调度与自动扩缩容。 分布式计算支持 原生架构天然支持分布式系统,模型训练过程中的并行计算需求可以通过上的分布式集群轻松实现,从而加速模型收敛速度。 模型原生能力 提出新挑战 尽管原生对于模型有着天然的优势,但是面对LLM、AIGC这样的新领域,依然对原生能力提出了更多挑战。 ,统一管理、运维和分配,通过弹性和软硬协同优化,持续提升资源利用率。

    53610编辑于 2024-02-26
  • 解锁原生后端开发新姿势:腾讯模型API实战攻略

    原生后端与模型融合的开篇之章 在数字化浪潮汹涌澎湃的当下,原生后端开发已然成为构建高效、灵活且可扩展应用的关键基石。 总结与展望 在本次探索原生后端与腾讯模型 API 融合的旅程中,我们深入了解了原生后端开发的核心技术,包括微服务架构、容器化技术、服务发现与配置管理以及 Kubernetes 编排等,这些技术共同构成了原生后端的坚实基础 通过实际的代码实战,我们成功地基于腾讯模型 API 构建了原生后端服务,实现了智能问答、文档解析与信息抽取等核心功能,并将其与其他原生组件进行了集成。 同时,原生技术也将不断发展,为模型的应用提供更加稳定、高效的运行环境。 总之,原生后端与模型技术的融合是技术发展的必然趋势,将为各行各业带来更多的创新和变革。

    1.6K10编辑于 2025-03-23
  • 来自专栏AI SPPECH

    模型原生环境中的运维实践指南

    引言 原生架构已经成为现代企业IT基础设施的主流选择,而模型技术的快速发展为原生运维带来了前所未有的机遇。 二、模型原生运维的价值 三、容器集群智能监控实践 四、Kubernetes故障智能诊断 五、原生资源智能优化 六、模型原生安全中的应用 七、实践案例与经验分享 八、工具推荐与使用指南 九 自动化生成:自动生成配置、脚本和故障处理方案 2.2 模型原生运维中的应用场景 模型技术可以广泛应用于原生运维的各个环节: 模型原生运维中的应用场景 监控告警智能分析 → 故障智能诊断 安全合规保障:确保模型的使用符合企业的安全和合规要求 人机协同:将模型作为辅助工具,与人工判断相结合 成本控制:合理规划和控制模型的使用成本 渐进式实施:从小规模试点开始,逐步扩大应用范围 九、 在使用模型进行原生运维时,你认为最重要的安全考虑因素是什么?如何确保模型的使用符合企业的安全要求? 结合你的实际工作经验,你认为模型原生运维中最有价值的应用场景是什么?为什么?

    60110编辑于 2025-11-13
  • 来自专栏有文化的技术人

    OPA—原生策略模型

    OPA 主要为了解决原生应用的访问控制、授权和策略。OPA 是通用的,与平台无关。请求和响应是以 JSON 格式发送的。 OPA将决策与策略执行解耦。 简而言之,Kubernetes API 提供了一个强大的、可扩展的、统一的资源模型,但也正是这个资源模型使得 RBAC 对于很多用例来说过于粗粒度。

    93610编辑于 2023-12-11
  • 2025原生模型部署实战:基于腾讯构建高可用推理服务

    本文基于服务某金融科技企业的真实项目经验,详解如何利用腾讯容器服务(EKS)、GPU服务器(CGP)等产品,构建一套支持1000+并发、可用性达99.9%的模型推理服务,同时将推理成本降低40%。 二、技术选型:腾讯产品矩阵的协同优势模型部署的核心是平衡性能、成本与稳定性,我们基于腾讯产品特性设计了三层架构,各组件协同形成技术闭环:1. ,将本地咨询请求的延迟降至50ms以内六、结语:原生赋能模型落地本次金融级模型部署的成功,核心在于腾讯产品矩阵的协同优势——EKS提供灵活的编排能力,CGP保障高性能算力,COS实现低成本存储, 对于企业开发者而言,模型部署不再是"玄学",而是可通过"模型优化+原生架构+弹性策略"实现的标准化流程。 欢迎在评论区分享你的模型部署经验,也可关注我后续将发布的《模型微调与部署全手册》系列文章。

    1.4K10编辑于 2025-12-10
  • 来自专栏AI科技评论

    从炼模型到大小模型协同进化!产研界联合发布端协同平台“洛犀”

    该平台提供一站式的端协同模型训练、部署、通信能力,致力于促进大小模型协同进化,构建充分利用模型应用潜力的新一代人工智能体系。 2022达摩院十科技趋势指出,模型参数竞赛正进入冷静期,大小模型将在边端协同进化——模型向边、端的小模型输出模型能力,小模型负责实际的推理与执行,同时小模型再向模型反馈算法与执行成效,让模型的能力持续强化 其中,平台在端侧以python/js package的形式提供服务,包含表征、文本理解、图计算等能力;在端链路上,平台提供实现端协同关键的通信能力,包括方案分发、数据通信链路;端协同模型训练累积沉淀在云端 此外,团队还借助洛犀完成了图神经网络、排序模型、强化学习等技术在端协同范式下的部署。 浙江大学上海高等研究院常务副院长吴飞教授如此形容大小模型间的辩证关系。庞大的须弥山如何纳入极微小的种子中? 达摩院智能计算实验室负责人周靖人介绍,团队将进一步探索端协同框架下端模型模型协同机理,并完善算法方案和业务实践。洛犀平台未来计划对开发者开放,让大小模型协同进化的时代加速到来。

    1.8K10编辑于 2022-03-03
  • 来自专栏云原生技术社区

    AIGC时代,基于原生 MLOps 构建属于你的模型(上)

    为了满足企业在数字化转型过程中对更新迭代生产力工具的需求,灵雀近日推出了原生 MLOps 解决方案,帮助企业快速落地AI技术、实现智能化应用和服务。 为什么要打造原生MLOps解决方案? 为了解决这些问题,灵雀作为原生领域领军企业,近日推出了企业级原生 MLOps 解决方案以及其开源版本 kubeflow-chart,致力于最大程度地降低企业应用 AI 能力的门槛,使企业获得高效、 SQL 训练:集成 SQLFlow,使用 SQL 语言完成模型训练和预测。 9. 模型:在数据存储、分布式训练、模型存储等 MLOps 关键环节,支持模型的存储和调用。 10. AML涵盖数据集管理、机器学习开发、模型训练、模型/推理服务四功能模块,无论是传统数据挖掘机器学习,还是深度学习和超大规模语言模型、对话 AI 等应用方向,都能充分发挥其强大功能。 灵雀此次推出的原生 MLOps 解决方案将为企业提供一个全流程支持的平台,帮助企业实现快速的 AI 落地和价值创造。

    1K20编辑于 2023-08-09
  • 腾讯AI模型与全域底座重构跨境货代协同网络

    构建全渠道通讯协同与AI模型矩阵 针对系统割裂与运力匹配难题,腾讯依托底座能力部署跨境货代专属的智能化应用与PaaS平台,打通业务协同数据链: 部署全栈智能应用:集成货代智能助手(涵盖销售人员管理、 落地AI行业场景:引入知识引擎/混元模型,将AI能力下沉至物流单据OCR、智能撮合、货运规划与无人仓储等核心业务节点,推动自动化运营。 联合 100+ 生态伙伴,形成面向快递快运、网络货运、跨境货代、物流科技四领域的成熟行业级集成应用体系。 依托全球算力网络与原生数字底座 腾讯在基础设施广度与C端触达深度上构筑了明确的技术确定性,极大降低了跨境货代企业的研发与运维成本(Ops Cost): 抗风险的全球网布局:依托全球 26 个地理区域、 高性能算力底座支撑:以交通云图筑底,搭载公有/私有等分布式架构,并利用星脉架构AI算力平台提供高稳定性的AI演算支撑。

    13010编辑于 2026-05-30
  • 腾讯构建智能座舱AI Agent:端协同与混元模型驱动

    部署端协同Agentic AI架构与多场景智能体 由钟学丹(腾讯智慧出行副总裁)主导,腾讯推出以“应用为中心”的出行全场景智能解决方案,核心采用Agentic AI架构,具备三核心能力: 场景感知: 技术底座为升级的端协同座舱模型架构: 云端:搭载腾讯混元 Hy3模型,通过“快慢思考架构”实现同尺寸模型性能最优,推理效率提升46%(数据来源:元宝搜索业务验证),单意图识别准确率>95%,支持复杂语义解析与深度推理 智能体构建:开放混元云端模型、端侧模型及腾讯信源(美食、票务、健康医疗等),支持接入三方开源模型与信源。 选择腾讯的技术验证与生态优势 底层模型已获企业级验证:快慢思考架构的混元模型已在元宝、workbuddy、ima等核心业务中落地,推理效率提升46%,上下文理解、复杂推理、Agent能力显著优于同尺寸模型 低延迟高可靠架构:端协同架构实现单意图识别>95%、端侧延迟≤100ms,兼顾复杂场景深度理解与毫秒级响应,保障座舱系统稳定性与交互流畅度。

    35900编辑于 2026-06-01
  • 来自专栏大模型应用

    模型应用:模型时代的XGBoost:传统梯度提升树与模型协同应用.103

    XGBoost 与模型结合2.1 模型的核心痛点尽管模型能力强大,但在实际应用中存在明显短板:1. 过拟合特定模式:在小样本、强规律的结构化数据任务中,模型的泛化能力不如XGBoost;5. 数值计算精度低:模型对数值的精准计算能力弱,无法替代传统模型完成高精度的回归、分类任务。 负责处理结构化数据(如用户年龄、商品价格、交易金额)+ 模型输出的语义特征,完成精准的预测或分类任务;同时,XGBoost 的可解释性可以弥补模型黑箱的缺陷,模型的语义理解能力可以拓展 XGBoost 这种融合方案的准确率远高于单独使用 XGBoost,缺少语义特征,也高于单独使用模型,因为模型的数值建模能力弱。三、融合的核心原理1. 传统模型模型不是替代关系,而是协同关系。以前总觉得模型很高大上,传统模型过时了,现在才明白,能落地、能解决实际问题的组合才是最好的。

    28832编辑于 2026-05-11
  • 来自专栏深度学习与python

    字节跳动开源 AIBrix:填补原生模型推理“系统层”空白

    AIBrix 与 vLLM 等推理引擎深度协同,持续优化推理效率,并融合多项前沿研究成果,推动模型推理走向更加高效、可落地的生产化阶段。 设计理念 为应对上述挑战,AIBrix 的核心理念在于通过“引擎层”与“系统层”的紧密协同,搭建一个轻量化、原生的方案。 系统架构 AIBrix 包含控制平面组件与数据平面组件,并完全基于 Kubernetes 进行开发,采用完整的原生设计来确保系统的可扩展性、可靠性以及资源效率。 在模型社区,如 vLLM 正不断丰富自身 API(含 token、transcription、score 等),保持与引擎原生接口一致是一项不小的挑战。 通过与 vLLM 开源社区的深度协作,我们希望不断迭代并完善在原生环境下的模型部署架构,让企业能够更加轻量、弹性地构建面向生产的 LLM 推理服务。

    3.5K10编辑于 2025-03-07
  • 腾讯AI模型原生架构驱动数字能源转型的量化实践

    部署“数字底座+AI生态”的新型微电网络与碳资产系统 针对上述痛点,腾讯构建了以原生为核心、融合人工智能与大数据的全链路解决方案,打通数据采集、分析与安全合规的业务闭环: 原生与时序数据库(CSTDB AI模型与工业视觉质检(TI-AOI / TI-OCR): 采用“Pretrain + Finetune”范式,将AI技术下沉至制造业与能源场站。 提升算力效率与降低运维成本的量化ROI体现 通过引入腾讯原生计算资源、AI自动化与支付中台,客户在多个核心业务流程中实现了明确的量化财务与效能回报。 AI协同驱动场站无人化运维: 在新能源场站与电网巡检中部署AI模型,实现巡检点位覆盖率 85%。 能仓科技通过“荷储聚合 + AI模型数字化赋能”,实现了从“独立储能系统”到“AI模型交易”的跃升,并成功落地多个标杆项目: 中国竹子博览园光储充示范项目: 打造“光储充放”场景,部署光伏 148.5kW

    20510编辑于 2026-05-30
  • 来自专栏腾讯安全

    FreeBuf专访黎巍:云安全需要原生与闭环协同

    基于这一点,原生安全理念逐渐进入人们的视野。 原生的真正作用在于,基于的特点,从架构、开发到部署和维护等阶段全面打造企业级应用,形成关键链路的闭环,真正护航企业的上安全。 能够在产业互联网这一赛道快速布局推进,腾讯二十余年来在安全上的储备是一个极其关键的支撑。 从技术层面看,不管是哪种类型,原生都是最有效的解决方案。原生从字面解读可以是“生于,长于,用于”,是一类技术的统称,通过原生技术,可以构建出更易于弹性扩展的应用程序。 “我们希望基于原生安全理念,构建一套覆盖、管、端的闭环方案,而不是头痛医头脚痛医脚。”黎巍说。 当然,受限于资源、技术、资金等客观条件,并非所有厂商都能够实现全栈闭环的安全能力,即使像腾讯这样的行业领导者,也必须要通过构建原生安全生态的形式,引入生态伙伴的互补产品、以投资的方式实协同发力、或是谋求更深度的生态整合以实现技术产品和商机的共享

    68030发布于 2020-09-18
  • 来自专栏有文化的技术人

    OAM—原生下的应用模型

    所以说,OAM 带来的改变,就是提供了一种大家都可以遵循的、标准化的方式来定义更高层级的应用层抽象,并且把“关注点分离”作为这个定义模型的核心思想。 OAM规范模型 应用定义 OAM通过一个application配置来定义一个整体的应用实例,如下: apiVersion: core.oam.dev/v1alpha1 kind: ApplicationConfiguration

    1.2K20编辑于 2023-09-09
  • 腾讯金融:基于DeepSeek与模型的保险行业AI协同办公实践

    目前,保险企业在内部协同办公中普遍面临三核心痛点: 知识流转断层: 各部门业务知识独立管理且格式各异,缺乏统一标准与全周期管理;传统搜索无法有效跨格式提取信息,找知识效率低。 构建基于模型协同办公支撑体系 针对上述痛点,腾讯结合底层模型能力(包含接入DeepSeek及腾讯混元模型),构建了覆盖“知识库、人才培养、视频会议”三场景的AI办公应用矩阵: 搭建安全可控的本地 语义切分优化: 采用业内首个长文本切分模型,将OCR识别的标题提供给切分模型进行多级语义拆分,避免语义截断,大幅提升阅读理解准确率。 沉淀全栈模型技术底座与算法优势 在模型基础能力与算法准确性方面,腾讯智能模型展现了技术确定性。 在国际知名的C-MTEB榜单上,腾讯智能模型在8个中文任务中达到效果最优,其测试集准确率达到73.09%(最大长度8192),超越了同期同榜单的友商模型,为保险行业处理长文本、复杂图文混排及高并发协同办公提供了坚实的技术支撑

    21710编辑于 2026-05-30
  • 来自专栏大模型应用

    模型应用:TextRank+混元模型:轻量化算法与模型协同的文本摘要实践.99

    粗摘结果格式化:将粗摘的句子和关键词整理为标准格式,如JSON,便于模型理解5. 构造模型提示词:设计Prompt模板,将粗摘结果作为上下文,要求模型进行精炼、润色6. 调用模型API:向模型发送请求,传入构造好的提示词,等待返回结果7. 模型输出精摘/润色结果:模型返回优化后的摘要文本,语言更流畅、重点更突出8. 粗摘结果格式化粗摘结果是“核心句子列表 + 核心关键词列表”,需要格式化后传入模型,目的是让模型清晰理解需要处理的核心内容。 构造模型提示词提示词是模型输出质量的核心,初学者需遵循 “清晰、具体、有场景” 的原则。 六、模型在融合方案中的价值TextRank 的粗摘结果存在“碎片化、语义孤立、无场景适配”的问题,模型可针对性解决:1.

    28610编辑于 2026-05-07
  • 来自专栏算法一只狗

    LLama4 原生多模态模型

    Meta最新发布了原生多模态模型 Llama 4,一经亮相即登上LMSYS模型排行榜第二名,仅次于Google的Gemini-2.5-pro,分差仅为22分,实力可见一斑。 三个模型的关系如下图所示,Maverick和Scout均为从超大杯Behemoth模型上蒸馏而来。三个模型的具体参数和特点:1. 模型在编码任务中的表现,体现出良好的长序列预测能力,随着序列位置增加,预测的不确定性逐渐降低并趋于稳定,这反映了模型对上下文信息的良好利用。 视觉部分采用MetaCLIP编码器,与冻结的Llama主模型协同优化。 总结与展望Llama 4的发布,意味着Meta正式进入原生多模态模型竞争核心领域。

    94800编辑于 2025-05-01
  • 从AI底座到AI原生:重塑模型训推效率与底层部署范式

    报告人:李力(腾讯 副总裁) 应对生成式AI爆发下的算力调度与技术栈重构挑战 产业正加速从“+AI”向“AI+”转变,底层数据增长与企业部署需求暴增,正倒逼IT基础设施从传统原生向AI原生演进。 部署全栈模块化AI原生平台与智算套件 为承载AI原生应用,腾讯将底层架构重构为涵盖“基础设施、模型层、工程层、应用层”的全栈AI原生平台,并重磅发布支持专有与分布式形态的腾讯智算套件,实现一多芯与软硬协同 垂直行业模型性能超越: 金融模型以 百亿参数规模实现超越千亿参数模型的效果;医疗模型覆盖 98%医学知识,达到同级 SOTA(最优效果)水平。 承载头部模型企业与千行百业AI应用落地 AI原生平台不仅已接入腾讯内部 600+ 产品(含微信、QQ、腾讯会议、腾讯文档等),更广泛支撑了头部模型独角兽及多行业标杆客户的底层算力与模型训练需求: 沉淀万亿级模型自研技术与行业标准制定能力 底层架构技术领先: 腾讯基础模型具备 万亿级参数规模,并在国内率先采用 MOE(混合专家)架构,引领自研模型体系发展。

    18410编辑于 2026-05-31
  • 来自专栏绿盟科技研究通讯

    智能安全运营:模型工具协同与学习框架

    模型驱动的智能安全运营 模型技术的快速发展,给智能安全运营技术提供了全新的交互范式、任务分析范式与思路,并从分析维度、整合维度、协同维度,为经典网络空间人工智能技术栈的升级提供了重大机遇。 模型工具协同与学习框架 模型可以在网络安全运营中提供很多关键任务支撑的角色,如告警研判分析、报告摘要总结、响应执行建议、安全知识问答等等。 从实现LLM+SOAR的统一分析界面与协同框架来看,模型作为交互界面+决策大脑的角色更为关键。 从实现LLM+SOAR的统一分析界面与协同框架来看,模型作为交互界面+决策大脑的角色更为关键。 可以看到,ChatGPT等商用或开源模型的插件系统逐渐完善,AutoGPT、AgentGPT、HuggingGPT等诸多大模型驱动的开源工具协同与学习框架已成为模型领域的关键热点,Microsoft

    1K40编辑于 2023-08-31
领券