首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 腾讯云高性能智底座:打破瓶颈与加速AI生产释放的实践路径

    剖析大模型时代的与运维瓶颈 随着普惠AI浪潮的到来与大模型走向规模化应用,企业在AI基础设施(AI Infra)建设上面临显著的战略困境与业务瓶颈。 孤岛与改造成本: 外部业务难以直接获取大厂内部的优化实践,且底层框架的替换往往具有极强的代码侵入性,导致降本增效难以落地。 构建“存网数安”一体化的智生态 为解决上述痛点,腾讯云通过“一云多芯、软硬协同”的架构,提供全面覆盖、存储、网络、数据与安全的高性能智底座: 计算编排与基础架构 (HCC): 采用自研星星海AI 通过SDHN实现网络故障无感知的硬件故障隔离,支持qGPU对单卡进行5%超细粒度切分隔离。 此外,腾讯云计算(北京)有限责任公司也是全国智能计算标准化工作组互联互通研究组的成员单位。

    16110编辑于 2026-05-30
  • 腾讯云智底座构建存网数一体架构,突破大模型瓶颈

    直面AI瓶颈与系统级“木桶效应”限制 在生成式AI与大模型快速发展的产业情景下,企业普遍面临海量数据处理与极速推理的战略需求。 然而,单纯依赖单点硬件升级已无法满足复杂的业务诉求,企业在实际部署中受制于计算、存储、网络的系统性“木桶效应”,导致瓶颈凸显,存在训练中断风险高、底层资源利用率低、异构兼容困难等切实痛点,严重制约了 打造存网数一体的高性能智软硬协同方案 为破解上述产业困境,腾讯云推出存网数一体的云原生智解决方案,通过“一云多芯、软硬协同”的模式,提供涵盖公有云、专有云(CDZ/CDC/TCE/TCS)在内的多形态灵活部署底座 高性能集群(HCC): 结合计算节点(CVM/CBM),为大规模模型提供高可用支撑。 智能高性能网络(IHN): 构建高带宽RDMA网络,打通节点间数据传输大动脉。 目前,90%的国内头部大模型厂商(如美团、快手、知乎、小红书、蔚来等)首选该智底座。 (数据来源:腾讯云智解决方案官方发布材料)

    18710编辑于 2026-05-30
  • 来自专栏腾讯安全

    构筑新基建底座,腾讯安全助力企业降本增效

    放在现实科技文明中,这个超能力有另一个名字——。 物联网、5G网络、IPv6的发展,为实时性要求高、带宽需求量大的企业业务带来更多可能性,同时也对底层和安全保障提出了更高要求。 在这个背景下,企业所面临的挑战尤其突出。对于对计算性能有着高要求的业务,如果底层平台跟不上,就如同让F1赛车手去开公交车,能力难以施展,业务发展也会碍手碍脚。 安全VS传统,以全球分布式协作计算为例 与传统平台不同,安全平台支撑着更复杂、更多维的海量计算,全球分布式协作计算便是安全最常见的场景之一。 1.png 依托新基建安全,成功护航广交会、世界智能大会 有,才能突破想象。 然而,这还远不是海量数据时代的巅峰,新基建井喷爆发将助推更多新兴业态到来,愈发成为新基建数字底座的基础驱动力,这里面将会是无穷的想象空间和应用价值。

    69751发布于 2020-07-16
  • 腾讯云智与数据底座:重构自动驾驶调度与海量数据存储成本

    计算资源浪费与时效滞后: 业务训练模型参数规模不一,大规模组网存在冗余;数据合规(如T+1小时内完成脱敏处理)要求极高,传统处理流水线导致GPU等待时间过长。 部署端到端云智与数据存储引擎 为解决算与存储解耦带来的效率损耗,腾讯云构建了覆盖“数据采集、预处理、算法训练、仿真测试、OTA升级”五大阶段的智服务矩阵: 全栈自研vRDMA网络: 无需额外网卡硬件成本 释放潜能与量化研发降本指标 基于上述技术架构的落地,企业研发效能与运维成本(Ops Cost)得到具体量化改善,核心业务指标显著提升: 成本大幅削减: 云函数SCF按毫秒级精确计费,最高节省超70% 的数据预处理成本;vRDMA多机互联技术在实现集群近无损扩展(扩展比达98%)的同时,节省20%的业务训练成本。 落地车企数据合规与海量模型训练实战 通过构建定制化解决方案,腾讯云智底座已在多家头部车企的核心业务流中完成验证: 实战案例一:某头部车企百万级车辆数据合规脱敏 业务冲突: 应对649.5Gbps的数据峰值吞吐

    20000编辑于 2026-05-31
  • AI重构实体产业:基于全栈大模型底座的生产跃迁实践

    、能源、政务等)的数字化进程正面临从“工具辅助”向“核心生产”跨越的战略拐点。 在国家宏观政策(如《基础设施高质量发展行动计划》)驱动下,企业迫切需要解决以下核心瓶颈: 生产过程黑盒化: 传统的设备状态、能耗、环保监测依赖人工经验,缺乏全局数据图谱,导致运维成本居高不下且决策滞后 构建全栈AI关键技术图谱:从底层到场景应用的解决方案 为突破上述瓶颈,腾讯云构建了从底层到行业应用的“AI+”全栈技术图谱,推动产业在生产、体验、安全与模式四个维度实现进化: 夯实自研与基础框架 : 部署自研紫霄AI芯片与自研星脉高性能计算网络架构,提供底层支撑;整合TI-ACC加速组件与TNN开源推理框架。 沉淀硬核科技底座:自研生态与技术壁垒构建 腾讯云能够支持泛互联网、运营商、零售、制造等千行百业实现AI+大模型加速落地,其底层技术确定性源于深厚的研发积淀: 顶级算法与科研支撑: 核心算法由腾讯三大实验室提供直接支持

    9210编辑于 2026-05-31
  • 来自专栏鲜枣课堂

    ​筑、话东西:构建新型数据中心 打造数字经济新底座

    在三位专家看来,数字经济已经成为驱动我国经济增长的核心关键力量,而“东数西”工程和网络建设则是支撑数字经济发展的重要底座。 同时,这也是为了破解当前面临的一个难题——单点已经出现很多瓶颈,需要通过集群式、以网代的方式来发展,从而将水平推到一个更高的高度。 AI助力:构建网络“大脑” 构筑新型的网络基础设施是推动数字经济发展的重要举措,但网络是一个复杂巨系统工程,包括供给、管理、服务等多个方面。 “3”是指从上到下的三层,底层是网融合基础底座层,中间是以网大脑为核心的智能编排管理层,最上面是提供业务能力、业务开放和最终业务形态的运营服务层。 “中国移动基于3+2体系架构发布了《网络技术白皮书》,提出了十大方向的32个核心技术,如原生、网一体、路由等,目前正在开展技术攻关,协同产业界一起推动原创技术发展,共同构筑起算网络大厦。

    56120编辑于 2022-12-30
  • 来自专栏产品经理的人工智能学习库

    – computation

    文章目录 人工智能里的是什么? 在普通电脑中,CPU就提供了帮助电脑快速运行。玩游戏的时候需要显卡提供,帮助电脑快速处理图形。 而在 人工智能中,需要有类似CPU和GPU的硬件来提供,帮助算法快速运算出结果。 之前在算法里讲过,在制造木桌的过程中,工厂的流水线就是算法。 在那个例子中,工厂中的机器就像,机器越好越先进,制造的过程就越快。 ? 越大,速度越快 维基百科版本 Techpedia版本 是使用计算机技术完成给定目标导向任务的过程。 可以包括软件和硬件系统的设计和开发,用于广泛的目的 – 通常构建,处理和管理任何类型的信息 – 以帮助追求科学研究,制作智能系统,以及创建和使用不同的媒体娱乐和交流。 查看详情 维基百科版本 是使用计算机的任何活动。它包括开发硬件 和软件,以及使用计算机来管理和处理信息,进行交流和娱乐。是现代工业技术的一个至关重要的组成部分。

    2.7K30发布于 2019-12-18
  • 2025腾讯云金融AI:从底座到业务场景的落地路径

    构建金融级大模型应用的四步闭环 针对金融机构的落地需求,腾讯云提出了从底层到上层应用的完整建设路径,强调标准化与定制化结合。 1. 建设:提升训练与自愈效率 硬件与架构: 提供硬件选型与弹性架构设计。 效率指标: 腾讯云智支持从机器上架到开始训练仅需5分钟,并具备自动化的故障自愈能力。 2. 智能应用:场景化业务升级 基于与模型底座,生成式AI应用覆盖智能问答、知识管理2.0及办公协同(腾讯会议、文档、企业微信等)。 技术底座与生态支撑 选择腾讯云金融AI解决方案的核心在于其全栈技术能力与生态整合: 稳定性: 腾讯云智提供分钟级(5分钟)的训练启动能力,保障业务连续性。

    19410编辑于 2026-05-30
  • 来自专栏Alter聊科技

    为世界构建新的选择,AI原生计算正在重塑底座

    也就是说,Agent新范式不仅改变了我们使用AI的方式,正深刻影响整个底座的供求逻辑。 02AI原生计算正重塑底座因为Agent驱动的新范式,绝不限于推理算需求的增长数字,已经像一把手术刀切入IT架构的深水区。 做一个判断的话:AI原生底座的竞赛,早已从“产品能力”跃迁为“系统能力”,并将进一步演进为“生态能力”。 很长一段时间里,模型与底座的适配多为滞后的“被动适配”,周期往往长达数月。现在,模型与开始“双向奔赴”。 在软硬协同与生态网络的推动下,产业界不断将转化为可落地的生产,持续涌现出了不少标杆实践。在航空领域,南航依托昇腾打造的国产智底座,研发出了“天策航空求解器”。

    13510编辑于 2026-06-02
  • 联发科豹变:从底座到智能体生态的核心

    但在AI时代,芯片厂商仅仅提供已经不够。因为AI体验能否成立,取决于芯片、系统、模型、工具链、终端厂商和开发者之间的协同。 eNPU并不是为了追求峰值,而是为了支持常驻轻载AI模型,以更低功耗完成持续感知。 “经过这几年的优化,在手机上去年就已经到100TOPS了,今年可能还会再上升,看起来是可以足够满足应用需求。现在需要突破的就是带宽问题和内存大小的问题。” 与手机相比,汽车受电池限制较小,因此座舱平台可以提供更高。据介绍,天玑旗舰座舱平台CX-1可以达到400TOPS,能够支持更多应用。 但即便更强,汽车AI同样面临内存和带宽问题。 可以说,手机和汽车虽然形态不同,但在AI落地过程中遇到的核心工程问题是相似的:只是基础,真正决定体验的是系统级效率。

    22710编辑于 2026-05-19
  • 来自专栏科技云报道

    之后,“存”上位

    芯片的摩尔定律逐渐逼近物理极限,存开始从幕后走向台前,成为AI领域下一个关键赛点。 长期以来,伴随企业数字化转型所建设的“烟囱式”AI基础设施各自为战,数据奔流,价值却困于“堰塞湖”。 存中心作为新型的数据基础设施,正成为AI时代数据流通和融合应用的破题关键。 AI时代的 “数据决定论” AI技术的发展离不开三大要素:数据、算法和。 AI时代存储市场的 三座大山 随着AI技术持续突破,构筑更高效、更可靠的AI存底座成为大势所趋。当前,存储市场正在经历三个全新变化,主要聚焦在效率和成本方面。 构建AI时代新型 “数据粮仓” 与聚焦在“”不同,数据存聚焦在“数”和“存”,是数据生产要素处理的综合能力体现,肩负着为数字经济各种场景提供源源不断的“生产资料”的使命。 将目光投向更长远,新型AI存储很可能是撬动人工智能时代杠杆的另一个支点,“以存强”“以数助”亦是弯道超车的重要落点。当AI产业具备扎实的存底座,才能登高远眺,看见AI时代最美的风景。

    50900编辑于 2025-06-19
  • 分布式云:构建全域调度的企业数字化新底座

    部署全位置力矩阵与同源同构架构 为消除本地部署与公有云能力之间的鸿沟,腾讯云提供以腾讯云遨驰(分布式云操作系统)为核心的分布式云产品矩阵,实现公有云能力的本地化复制与延展。 该方案通过“位置、形式、规模”的全域覆盖,提供跨平台管理与专有合规上云服务: 中心云(大型可用区): 依托云原生分布式云中心(TDCC),实现跨云(云A、云B、IDC)统一纳管。 区域/边缘云(中小型可用区): 部署边缘云(TEZ/EdgeOne)与专属可用区(CDZ),满足音视频、游戏、政务等近场需求。 系统调度水位: 底层遨驰操作系统实现 1.5+ 亿核的调度,服务器操作系统 TencentOS 支撑 千万+ 节点运行,确保极端场景下的系统稳定性。 权威生态认证支持: 88款云产品成功进入工信部信息技术融合创新图谱,累计完成 300+ 测试互认证,为企业提供面向未来的、无缝支持AI应用的数字化底座首选。

    29110编辑于 2026-04-28
  • 腾讯云AGI解决方案与生态案例:从底座到业务增长

    行业困境:生成式AI落地面临的鸿沟与瓶颈 当前生成式AI技术在B端企业级市场仍处于早期阶段。根据SAS全球研究报告数据,全球仅有 11% 的企业将生成式AI充分实施到常规流程中。 成本压力: 以创客贴为代表的数字内容企业,在利用AI进行3D处理和推理时面临高昂的成本与效率瓶颈。 构建技术底座:腾讯云AGI全栈能力与生态合作 腾讯云于2024年9月推出《AI驱动业务创新 云夯实业务基础》实践报告,联合腾讯研究院、腾讯会议、腾讯文档及30余家行业企业,提供从基础设施到应用层的全栈解决方案 量化业务指标:成本与生产效率提升 通过采用腾讯云的基础设施与AI能力,合作企业在关键业务指标上实现了以下提升: 关键指标 量化结果 实施主体/案例 成本 降低 创客贴(利用腾讯云优势降低推理与 技术领先性与生态壁垒 选择腾讯云及生态合作伙伴的核心优势在于全链路的技术确定性与行业深耕: 底座确定性: 云端高性能(弹性、云原生、高速互联GPU集群)支持企业从研发到落地的敏捷迭代,解决如创客贴面临的成本与速度痛点

    9610编辑于 2026-05-30
  • 来自专栏科技云报道

    已成数字经济发展“热土”,成为数字化转型新底座

    随着数字化与智能化进程加快,对于的要求也越来越紧迫。成为全球技术创新竞争的焦点领域。 根据2022中国大会发布的数据显示,力作为数字经济时代新的生产正迅速发展。 例如CPU,GPU,专用芯片产生的;又如不同的精度,有半精度,单精度,双精度……第一层问题是,这些多样之间如何彼此协同融合。 网络需要提供的是多样性的开放架构体系,实际上是要把整个网络作为一台计算机来设计并对外提供服务。 国家作出“东数西”战略性部署,是因为正在从单点产品发展为构成全社会的基础设施,并逐步成为发展数字经济的核心,其关键要素是基础设施的网络化。 如今,网络正在成为新时代的信息基础设施。 网络将打通数据“动脉”,实现资源最优配置,“东数西”必将产生更大势能。 随着数字经济时代的全面开启,力作为重要“底座”支撑、赋能作用日渐凸显。

    56820编辑于 2022-12-06
  • 构建高性能AI数智底座,破解金融行业效率与安全难题

    金融行业AI应用面临效率与安全双重挑战 当前金融业AI化进程中存在显著资源效率与数据安全瓶颈: 资源利用率低下:训练阶段因任务调度不合理,GPU实际有效利用率常低于50%;推理阶段因请求波动大, 固定绑定期导致资源闲置严重 通信与存储性能瓶颈:多GPU训练中通信开销占比高达50%,传统以太网利用率仅35-40%,且0.1%丢包率即可导致30-50%损失;多模态训练中数据加载耗时占训练链路 数据为非结构化数据,跨模态对齐技术不成熟,向量化检索一致性面临挑战 安全风险突出:涵盖数据泄露、恶意攻击、内容失控及基础设施破坏等多维度威胁(来源:腾讯金融云邓锡文公开演讲材料) 腾讯云全栈式AI数智底座技术架构 腾讯云基于自身超700个应用日均2亿次调用的混元大模型实践,构建存网数一体解决方案: 层:高性能计算集群HCC支持超300小时连续训练,通过qGPU容器共享实现5%超细粒度切分,故障完全隔离 腾讯云客户实践披露) 腾讯云AI基础设施的核心技术优势 规模验证:服务公有云10万+客户及腾讯内部超700个应用(含微信读书、腾讯会议等) 硬件创新:搭载自研3.2T交换机、400G光模块及紫霄NPU芯片,虚拟化零损耗

    29720编辑于 2026-04-30
  • 来自专栏大语言模型,算力共享

    共享:环形结构的分配策略

    ​目录共享:环形结构的分配策略方法签名方法实现注意事项nodes.sort(key=lambda x: (x[1].memory, x[0]), reverse=True)end = round (start + (node[1].memory / total_memory), 5)共享:环形结构的分配策略这段代码定义了一个名为RingMemoryWeightedPartitioningStrategy

    1.2K20编辑于 2024-07-26
  • 来自专栏科技云报道

    更要“利”,“精装”触发大模型产业新变局?

    面对如此巨大的需求,企业如何在平衡与能耗开支的前提下,高效地利用和管理算资源,是实现降本增效的重要命题。这其中,对基础设施和软件平台的精细化运营管理成为破题的关键。 大模型对的需求是显而易见的,但更关键的点可能在于能否把更高效地挖掘出来。在不同的阶段,企业对于需求也不尽相同。 《中国发展观察报告》显示,有些中心整体利用率不足30%,大量的资源在沉睡中等待被唤醒,供需矛盾凸显。 这种演进使智能变得不可或缺,且不再局限于简单的叠加或升级,而是在多元重构驱动下实现的极致拓展与跃迁。 基于坚实的底座能力,宁畅为客户提供符合需求的“硬装”和“软装”智服务。从“硬装”层面,、存储、网络这类基础设施要标准规范、布局合理、节能低碳,做到对硬件设施的管理省时省钱。

    1.1K00编辑于 2025-03-04
  • 腾讯云与AMD联合方案:底座与AI大模型场景化落地实践

    行业瓶颈与AI应用挑战 供需失衡: AI大模型训练需求呈指数级增长,每3.4个月翻一倍(数据来源:1Epoch AI、2IDC、3国家数据局、4Gartner),企业面临短缺与成本压力。 基础设施挑战: AI大模型落地需应对资源供需、适配与成本优化、易用性与多生态兼容三大核心挑战。 资源利用率低: 在线业务存在明显潮汐现象,夜间容器资源闲置率高达500(相对峰值),导致浪费。 构建软硬一体化智底座 AMD 第五代 EPYC™(Turin)特性: 采用3nm/4nm工艺,最高192核心384线程,支持全AVX512指令集,IPC(每时钟周期指令数)提升17%。 市场认可度: 腾讯云智底座覆盖全国90%+的大模型客户,实测可用性达99.9%,经历腾讯内部600+业务及混元大模型自身训练的严苛验证。

    19110编辑于 2026-05-30
  • 构建全链路大模型精调底座:破解浪费与场景落地瓶颈

    直击模型落地痛点:规避空耗与行业知识断层 当前,大模型从“量变”走向“质变”,但在实际业务落地过程中,企业普遍面临底层调度与模型专业性的双重瓶颈。 节点资源碎片化导致调度成功率低,系统缺乏高效的故障隔离、自动容错与断点续训底座能力,极大地推高了企业的运维成本(Ops Cost)与试错成本。 资源利用率(ROI)极化:在特定行业数据精调下,仅需10亿参数的行业大模型,即可达到与千亿参数通用大模型相近的特定任务性能,大幅降低企业的采购与训练成本。 依托TI平台高稳定性任务调度与故障节点自动隔离能力,实现了单任务连续2~3个月的稳定持续运行,大幅降低了闲置率。 全生命周期信创支持:深度适配国产化基础设施,支持鲲鹏、昇腾(NPU)、飞腾、海光等主流信创CPU/AI加速芯片的分配与调度,全面兼容腾讯TencentOS、银河麒麟操作系统及TDSQL数据库,并已获得

    16310编辑于 2026-05-30
  • 来自专栏ADAS性能优化

    生存VS

    英國「金融時報」報導,鑒於美國近期祭出制裁來壓制中國電腦運能力,中國科技企業阿里巴巴和壁仞科技為了避免受制裁,正將各自最先進晶片的設計微調,以降低運處理速度。 華府10月宣布的制裁措施,禁止任何運能力超過一定門檻的半導體產品出貨至中國除非得到许可。這打亂了上述中國科技企業的發展計畫。 但中國工程師表示,要判斷哪些晶片產品不受制裁並不簡單,因為華府對於如何計這個速率沒有清楚規範。 根據研究集團伯恩斯坦(Bernstein)計,從壁仞官方網站存檔紀錄來看,在美國宣布制裁之前,壁仞首款處理器BR100的規格算出傳輸率是640 GB/s,超過限制門檻;但根據壁仞官網目前發布的BR100

    1.3K20编辑于 2022-12-20
领券