首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏RTSP服务器

    AI时代底层技术链:GPU、原生模型协同进化全解析

    模型训练一次要烧掉上亿人民币? 计算巨头都在抢「算力调度业务」? 各国发布「AI 国家战略」? 看新闻仿佛置身一场术语混战: AI、模型、GPU、原生,到底在说啥? 是彼此替代? 高效烹饪体系算力底座餐厅管理与食材供应系统原生(Cloud Native)流程调度算力管理基础设施一句话总纲: GPU 提供算力 → 原生调度算力 → 模型实现智能 → 人工智能走向真实世界价值落地 技术链路全景图用一句最清晰的话总结: 想要 AI 改变世界 → 需要模型 想要模型跑起来 → 需要海量 GPU 想要 GPU 集群不崩溃且不烧钱 → 需要原生 形成如下技术金字塔结构:它们不是并列概念 因为每一层都体现国家竞争力与产业控制力:层级决定因素产业战略价值GPU制造能力、供应链、安全可控卡脖子最严重、最稀缺资源原生算力调度能力、规模管理算力是否可成为基础设施模型算法积累与数据规模通用智能竞争壁垒 AI 应用行业落地与生态真实生产力转化一句话: 谁掌握 GPU、原生模型,谁就能定义 AI 的未来 结语:时代的底层规律当我们仰望人工智能的璀璨时,别忘了它脚下的地基: GPU 承担算力之力 原生

    43310编辑于 2025-12-08
  • 来自专栏科技云报道

    原生模型“降本增效”的解药吗?

    那么,原生是如何帮助模型降本增效,在这个过程中又遇到了哪些挑战? 原生成为模型的标配 近年来,容器和Kubernetes已经成为越来越多AI应用首选的运行环境和平台。 随着模型浪潮的到来,以原生环境运行AI应用正在变成一种事实标准。 弹性伸缩与资源管理 模型训练往往需要大量的计算资源,而原生环境通过容器化和编排工具可以实现资源的弹性调度与自动扩缩容。 分布式计算支持 原生架构天然支持分布式系统,模型训练过程中的并行计算需求可以通过上的分布式集群轻松实现,从而加速模型收敛速度。 模型原生能力 提出新挑战 尽管原生对于模型有着天然的优势,但是面对LLM、AIGC这样的新领域,依然对原生能力提出了更多挑战。 ,统一管理、运维和分配,通过弹性和软硬协同优化,持续提升资源利用率。

    47610编辑于 2024-02-26
  • 解锁原生后端开发新姿势:腾讯模型API实战攻略

    原生后端与模型融合的开篇之章 在数字化浪潮汹涌澎湃的当下,原生后端开发已然成为构建高效、灵活且可扩展应用的关键基石。 总结与展望 在本次探索原生后端与腾讯模型 API 融合的旅程中,我们深入了解了原生后端开发的核心技术,包括微服务架构、容器化技术、服务发现与配置管理以及 Kubernetes 编排等,这些技术共同构成了原生后端的坚实基础 通过实际的代码实战,我们成功地基于腾讯模型 API 构建了原生后端服务,实现了智能问答、文档解析与信息抽取等核心功能,并将其与其他原生组件进行了集成。 同时,原生技术也将不断发展,为模型的应用提供更加稳定、高效的运行环境。 总之,原生后端与模型技术的融合是技术发展的必然趋势,将为各行各业带来更多的创新和变革。

    1.2K10编辑于 2025-03-23
  • 来自专栏有文化的技术人

    OPA—原生策略模型

    OPA 主要为了解决原生应用的访问控制、授权和策略。OPA 是通用的,与平台无关。请求和响应是以 JSON 格式发送的。 OPA将决策与策略执行解耦。 简而言之,Kubernetes API 提供了一个强大的、可扩展的、统一的资源模型,但也正是这个资源模型使得 RBAC 对于很多用例来说过于粗粒度。

    81010编辑于 2023-12-11
  • 来自专栏AI科技评论

    从炼模型到大小模型协同进化!产研界联合发布端协同平台“洛犀”

    该平台提供一站式的端协同模型训练、部署、通信能力,致力于促进大小模型协同进化,构建充分利用模型应用潜力的新一代人工智能体系。 2022达摩院十科技趋势指出,模型参数竞赛正进入冷静期,大小模型将在边端协同进化——模型向边、端的小模型输出模型能力,小模型负责实际的推理与执行,同时小模型再向模型反馈算法与执行成效,让模型的能力持续强化 其中,平台在端侧以python/js package的形式提供服务,包含表征、文本理解、图计算等能力;在端链路上,平台提供实现端协同关键的通信能力,包括方案分发、数据通信链路;端协同模型训练累积沉淀在云端 此外,团队还借助洛犀完成了图神经网络、排序模型、强化学习等技术在端协同范式下的部署。 浙江大学上海高等研究院常务副院长吴飞教授如此形容大小模型间的辩证关系。庞大的须弥山如何纳入极微小的种子中? 达摩院智能计算实验室负责人周靖人介绍,团队将进一步探索端协同框架下端模型模型协同机理,并完善算法方案和业务实践。洛犀平台未来计划对开发者开放,让大小模型协同进化的时代加速到来。

    1.7K10编辑于 2022-03-03
  • 来自专栏AI SPPECH

    模型原生环境中的运维实践指南

    引言 原生架构已经成为现代企业IT基础设施的主流选择,而模型技术的快速发展为原生运维带来了前所未有的机遇。 二、模型原生运维的价值 三、容器集群智能监控实践 四、Kubernetes故障智能诊断 五、原生资源智能优化 六、模型原生安全中的应用 七、实践案例与经验分享 八、工具推荐与使用指南 九 自动化生成:自动生成配置、脚本和故障处理方案 2.2 模型原生运维中的应用场景 模型技术可以广泛应用于原生运维的各个环节: 模型原生运维中的应用场景 监控告警智能分析 → 故障智能诊断 安全合规保障:确保模型的使用符合企业的安全和合规要求 人机协同:将模型作为辅助工具,与人工判断相结合 成本控制:合理规划和控制模型的使用成本 渐进式实施:从小规模试点开始,逐步扩大应用范围 九、 在使用模型进行原生运维时,你认为最重要的安全考虑因素是什么?如何确保模型的使用符合企业的安全要求? 结合你的实际工作经验,你认为模型原生运维中最有价值的应用场景是什么?为什么?

    41710编辑于 2025-11-13
  • 2025原生模型部署实战:基于腾讯构建高可用推理服务

    本文基于服务某金融科技企业的真实项目经验,详解如何利用腾讯容器服务(EKS)、GPU服务器(CGP)等产品,构建一套支持1000+并发、可用性达99.9%的模型推理服务,同时将推理成本降低40%。 二、技术选型:腾讯产品矩阵的协同优势模型部署的核心是平衡性能、成本与稳定性,我们基于腾讯产品特性设计了三层架构,各组件协同形成技术闭环:1. ,将本地咨询请求的延迟降至50ms以内六、结语:原生赋能模型落地本次金融级模型部署的成功,核心在于腾讯产品矩阵的协同优势——EKS提供灵活的编排能力,CGP保障高性能算力,COS实现低成本存储, 对于企业开发者而言,模型部署不再是"玄学",而是可通过"模型优化+原生架构+弹性策略"实现的标准化流程。 欢迎在评论区分享你的模型部署经验,也可关注我后续将发布的《模型微调与部署全手册》系列文章。

    88510编辑于 2025-12-10
  • 来自专栏深度学习与python

    字节跳动开源 AIBrix:填补原生模型推理“系统层”空白

    AIBrix 与 vLLM 等推理引擎深度协同,持续优化推理效率,并融合多项前沿研究成果,推动模型推理走向更加高效、可落地的生产化阶段。 设计理念 为应对上述挑战,AIBrix 的核心理念在于通过“引擎层”与“系统层”的紧密协同,搭建一个轻量化、原生的方案。 系统架构 AIBrix 包含控制平面组件与数据平面组件,并完全基于 Kubernetes 进行开发,采用完整的原生设计来确保系统的可扩展性、可靠性以及资源效率。 在模型社区,如 vLLM 正不断丰富自身 API(含 token、transcription、score 等),保持与引擎原生接口一致是一项不小的挑战。 通过与 vLLM 开源社区的深度协作,我们希望不断迭代并完善在原生环境下的模型部署架构,让企业能够更加轻量、弹性地构建面向生产的 LLM 推理服务。

    3.2K10编辑于 2025-03-07
  • 来自专栏云原生技术社区

    AIGC时代,基于原生 MLOps 构建属于你的模型(上)

    为了满足企业在数字化转型过程中对更新迭代生产力工具的需求,灵雀近日推出了原生 MLOps 解决方案,帮助企业快速落地AI技术、实现智能化应用和服务。 为什么要打造原生MLOps解决方案? 为了解决这些问题,灵雀作为原生领域领军企业,近日推出了企业级原生 MLOps 解决方案以及其开源版本 kubeflow-chart,致力于最大程度地降低企业应用 AI 能力的门槛,使企业获得高效、 SQL 训练:集成 SQLFlow,使用 SQL 语言完成模型训练和预测。 9. 模型:在数据存储、分布式训练、模型存储等 MLOps 关键环节,支持模型的存储和调用。 10. AML涵盖数据集管理、机器学习开发、模型训练、模型/推理服务四功能模块,无论是传统数据挖掘机器学习,还是深度学习和超大规模语言模型、对话 AI 等应用方向,都能充分发挥其强大功能。 灵雀此次推出的原生 MLOps 解决方案将为企业提供一个全流程支持的平台,帮助企业实现快速的 AI 落地和价值创造。

    92520编辑于 2023-08-09
  • 来自专栏腾讯安全

    FreeBuf专访黎巍:云安全需要原生与闭环协同

    基于这一点,原生安全理念逐渐进入人们的视野。 原生的真正作用在于,基于的特点,从架构、开发到部署和维护等阶段全面打造企业级应用,形成关键链路的闭环,真正护航企业的上安全。 能够在产业互联网这一赛道快速布局推进,腾讯二十余年来在安全上的储备是一个极其关键的支撑。 从技术层面看,不管是哪种类型,原生都是最有效的解决方案。原生从字面解读可以是“生于,长于,用于”,是一类技术的统称,通过原生技术,可以构建出更易于弹性扩展的应用程序。 “我们希望基于原生安全理念,构建一套覆盖、管、端的闭环方案,而不是头痛医头脚痛医脚。”黎巍说。 当然,受限于资源、技术、资金等客观条件,并非所有厂商都能够实现全栈闭环的安全能力,即使像腾讯这样的行业领导者,也必须要通过构建原生安全生态的形式,引入生态伙伴的互补产品、以投资的方式实协同发力、或是谋求更深度的生态整合以实现技术产品和商机的共享

    62330发布于 2020-09-18
  • 来自专栏有文化的技术人

    OAM—原生下的应用模型

    所以说,OAM 带来的改变,就是提供了一种大家都可以遵循的、标准化的方式来定义更高层级的应用层抽象,并且把“关注点分离”作为这个定义模型的核心思想。 OAM规范模型 应用定义 OAM通过一个application配置来定义一个整体的应用实例,如下: apiVersion: core.oam.dev/v1alpha1 kind: ApplicationConfiguration

    1.1K20编辑于 2023-09-09
  • 来自专栏绿盟科技研究通讯

    智能安全运营:模型工具协同与学习框架

    模型驱动的智能安全运营 模型技术的快速发展,给智能安全运营技术提供了全新的交互范式、任务分析范式与思路,并从分析维度、整合维度、协同维度,为经典网络空间人工智能技术栈的升级提供了重大机遇。 模型工具协同与学习框架 模型可以在网络安全运营中提供很多关键任务支撑的角色,如告警研判分析、报告摘要总结、响应执行建议、安全知识问答等等。 从实现LLM+SOAR的统一分析界面与协同框架来看,模型作为交互界面+决策大脑的角色更为关键。 从实现LLM+SOAR的统一分析界面与协同框架来看,模型作为交互界面+决策大脑的角色更为关键。 可以看到,ChatGPT等商用或开源模型的插件系统逐渐完善,AutoGPT、AgentGPT、HuggingGPT等诸多大模型驱动的开源工具协同与学习框架已成为模型领域的关键热点,Microsoft

    93940编辑于 2023-08-31
  • 来自专栏算法一只狗

    LLama4 原生多模态模型

    Meta最新发布了原生多模态模型 Llama 4,一经亮相即登上LMSYS模型排行榜第二名,仅次于Google的Gemini-2.5-pro,分差仅为22分,实力可见一斑。 三个模型的关系如下图所示,Maverick和Scout均为从超大杯Behemoth模型上蒸馏而来。三个模型的具体参数和特点:1. 模型在编码任务中的表现,体现出良好的长序列预测能力,随着序列位置增加,预测的不确定性逐渐降低并趋于稳定,这反映了模型对上下文信息的良好利用。 视觉部分采用MetaCLIP编码器,与冻结的Llama主模型协同优化。 总结与展望Llama 4的发布,意味着Meta正式进入原生多模态模型竞争核心领域。

    76900编辑于 2025-05-01
  • 腾讯模型智能体解决方案:重塑企业知识资产与业务协同效率

    搭建企业级多模态智能体,重构员工培训与工作流体系 为了将通用AI能力转化为企业独特的生产力,腾讯推出了基于模型的智能体开发平台,通过建立“AI驱动的企业知识中心”,实现“通用AI能力 + 企业独特知识经验 OCR的模型解析引擎,突破复杂版面分析与元素识别瓶颈。 回答完整性提升 20%: 采用业内首个基于语义判断的知识切分模型,替代传统正则切分方式,大幅降低信息截断造成的语义缺失。 精准的知识溯源与图文推理: 结合RAG与DeepSeek模型模型能够读懂“图文关系”(如说明书中的数据图、自然场景图),支持文搜图、图搜图;问答结果可精准定位至文档具体页数或音视频的特定时间点。 整合全栈基础设施与原生SaaS,构筑企业级安全互联底座 模型应用的规模化落地,依赖于底层算力、网络及协同工具的全面支撑。

    20920编辑于 2026-04-04
  • 来自专栏CNCF

    OpenYurt 深度解读:如何构建 Kubernetes 原生边高效协同网络?

    作者 | 郑超 导读:OpenYurt 是阿里巴巴开源的协同一体化架构,与同类开源方案相比,OpenYurt 拥有可实现边缘计算全场景覆盖的能力。 因此,为了支持通过云端节点对边缘端应用进行运维操作,我们必须在、边之间建立反向运维通道。 ? 反向通道 Yurttunnel 是 OpenYurt 近期开源的一个重要组件,用来解决边通信问题。 为 ANP 添加代理策略 在 OpenYurt 的网络模型下,边缘节点分布在不同的 network region 中,随机选择的 agent 可能无法将请求转发至位于其他 region 内的节点上。 经过长时间运行,容器的日志文本常常可以达到十几兆,为了模拟获取文本日志的场景。 OpenYurt 于 2020 年 5 月 29 日正式对外开源,借助社区和广大开发者的力量快速成长,开源仅 3 个月后就正式成为 CNCF 沙箱级别边缘计算原生项目。

    1.7K10发布于 2020-11-17
  • 原生PaaS服务平台-对象模型思考

    在前面谈原生技术解决方案和PaaS平台的时候,更多都是从技术平台层面进行阐述,如果真在要转变为面向多租户的PaaS服务平台,那么就需要一个完整的底层对象模型支撑。 一个应用本身有可以分解为多个微服务模块,实际上在原生PaaS平台下,最终进行持续集成,部署交付的都是微服务模块。每个微服务都独立进行构建和部署交付。多个微服务模块构成一个完整的应用系统。 根据阿里的说法,在PaaS的核心领域模型中,不再尝试定义“环境”这个模型,因为环境的概念在不同组织的研发协同流程中定义是不一致的,所以环境可以根据当前的PaaS领域模型组合搭建。 PaaS平台多租户模型 上图为Gartner的多租户参考架构 在私有云和公用环境对多租户的理解上是有不同的概念的。 在公用下的多租户,如果采用完全共享的模式,还必须考虑数据库的可扩展性,多租户架构服务提供独立数据库、扩展表和表(保留字段)三种多租户架构,开发者可以通过API创建和管理多租户架构。

    42710编辑于 2025-06-24
  • 来自专栏腾讯云原生团队

    技术分享 | 原生模型 NoSQL 概述

    快速适配,包括可扩展多模型API和存储引擎框架。可扩展多模型 API,方便协同方根据业务场景需求定制访问协议。 原生能力设计与思考 可扩展和原生是我们设计多模型 NoSQL 时考虑的两个目标。前面介绍了实现扩展性的相关的架构内容,系统助于扩展性,支持多种数据访问、API 和存储引擎来实现多模型存储。 接下来我想分享下在原生上的设计思考。 原生这个词是最近几年大家经常听到的概念,但当你百度这个概念时却发现很难比较清晰的理解。我个人的理解,原生核心有两个概念,原生产品和原生技术。 原生产品是在公有普及的背景下,站在客户的视角,对云端提供服务的产品提出的能力和要求,比如弹性伸缩、可观测性等。 原生技术是帮助实现原生产品的技术手段,如容器、服务网格、微服务、不可变的基础设施和声明式 api 等。多模型 NoSQL 从设计之初,我们就与相关的原生技术进行紧密结合,考虑了基于原生的能力。

    1K40编辑于 2022-05-23
  • 《解锁元宇宙构建:AI与原生区块链的协同奥秘》

    原生区块链技术的去中心化架构,为元宇宙的开放公平提供了坚实的保障。 而原生区块链的智能合约技术,为元宇宙构建了一套高效、安全、可信的经济秩序。 AI与原生区块链融合,开启元宇宙的“无限可能”AI与原生区块链技术在元宇宙的构建中各有优势,二者的融合将产生更为强大的协同效应,为元宇宙的发展带来无限可能。 AI可以借助原生区块链的去中心化架构和智能合约,实现更加安全、可信的模型训练和数据共享。在传统的AI模型训练中,数据往往集中存储在少数机构或平台上,存在数据泄露和隐私侵犯的风险。 同时,区块链的可追溯性使得AI模型的训练过程和数据来源更加透明,有助于提高模型的可信度和可解释性。原生区块链也可以利用AI的智能决策和数据分析能力,优化自身的性能和功能。

    31800编辑于 2025-03-19
  • 来自专栏深度学习与python

    大数据在模型趋势下的“新姿态”:模型与企业数据充分协同

    作者 | 鲁冬雪 随着大数据、人工智能和计算等技术的不断发展,模型成为了企业数据体系中不可或缺的一部分。模型趋势下,企业数据体系面临着新的挑战和机遇。 过去半年模型的飞速发展给行业非常的震撼,数巅科技近期在模型上也做了一些事情,探索怎么能让模型跟企业数据充分的协同起来,这样能够真正释放大模型的潜力,能够释放大数据的价值。 数巅科技却不是这样认为的——模型不能取代数据计算存储体系的作用,其实模型是需要跟企业的数据做深度协同才能够真正地做出一个好的决策。 这就意味着,在企业部署模型之后,构建可以自我演进的模型框架是一个关键课题,自我迭代的模型应用框架可以帮助企业根据自己的数据体系来构建模型应用,让企业数据与模型充分协同后发挥出最大价值。 目前数巅科技的愿景就是完美实现“模型与企业数据的充分协同”,正如何博士在演讲后接受 InfoQ 专访时所说的那样,“我希望企业可以通过我们的产品能够充分地把数据能够管好、用好,能够跟模型深度地协同起来

    2.8K40编辑于 2023-08-09
  • 来自专栏《C++与 AI:个人经验分享合集》

    《解锁元宇宙构建:AI与原生区块链的协同奥秘》

    原生区块链技术的去中心化架构,为元宇宙的开放公平提供了坚实的保障。 而原生区块链的智能合约技术,为元宇宙构建了一套高效、安全、可信的经济秩序。 AI与原生区块链融合,开启元宇宙的“无限可能” AI与原生区块链技术在元宇宙的构建中各有优势,二者的融合将产生更为强大的协同效应,为元宇宙的发展带来无限可能。 AI可以借助原生区块链的去中心化架构和智能合约,实现更加安全、可信的模型训练和数据共享。在传统的AI模型训练中,数据往往集中存储在少数机构或平台上,存在数据泄露和隐私侵犯的风险。 同时,区块链的可追溯性使得AI模型的训练过程和数据来源更加透明,有助于提高模型的可信度和可解释性。 原生区块链也可以利用AI的智能决策和数据分析能力,优化自身的性能和功能。

    17800编辑于 2025-03-20
领券