首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏星融元

    深度剖析:网络网融合

    前文介绍了与云网融合的关系,那么网络网融合的关系又是什么?让我们先来复习一下的概念。 不仅提升了计算能力,还为各行各业带来了智慧的变革,成为推动科技进步的重要引擎。网络的概念网络是实现泛在力的手段。 三者的关系是什么通过上文对概念的描述,我们可以将翻译为“数据+力+算法”,如图4所示。涉及丰富的计算场景,需要用到大模型计算,处理海量数据。基于的这种特性,力需求激增。 此时需要网络力进行调度,使得云、边、端都能得到灵活的资源分配,便催生出了网络。而网络整合了强大的计算能力和高效的网络资源,为提供坚实的基础设施。 网络网融合为提供了强大的技术支撑,而的发展推动了网融合和网络的进步,他们三者是相互促进的关系。时代如何打造网络时代下,如何打造网络,做到网融合呢?

    2.1K10编辑于 2024-08-30
  • 揭秘AI中心网络流量之AI推理

    本篇为“揭秘AI中心网络流量“系列的第二篇,前篇请参阅:一文揭秘AI中心网络流量 – 大模型训练篇 。有关数据存储流量的分析将于下篇呈现,敬请关注。 这便要求基础设施具备相当的开放性——网络不但要连接底层的异构力(GPU、CPU、NPU)系统,还需要实现与上层管理系统的对接集成,例如与基于K8s的力调度平台、已有的云管平台等等。 随着大模型的应用不断深化,AI力部署将从训练场景逐步转向推理,推理需求也逐渐从云端迁移至边缘/终端,并呈现出垂直行业定制化的趋势。 在已被用户场景充分验证的数据中心开放云网能力之上(BGP、VXLAN、Calico容器路由、RoCE、NVMe-oF等),星融元推出的 星AI 网络解决方案基于通用、解耦、高性能的以太网硬件和开放的SONiC 软件框架,为AI中心提供10G-800G速率的以太网交换机,灵活支持单一速率或混合速率交换机组网,在保持极致性能的同时可编程、可升级,帮助客户构建高性能的AI中心网络,提供用于AI训练、推理、分布式存储

    1K10编辑于 2024-07-26
  • 来自专栏智能人工

    计算正向跨越

    “计算力不仅是生产力,还是创造力,计算正向跨越。” 浪潮信息总裁彭震认为,计算力和算法是中心的核心,要想产生一流的智慧,就必须要有一流的算法,同时算法的高效运转要依赖领先的计算力,计算力基建化和算法基建化相辅相成。  力总规模超过140每秒浮点运算次数,近5年年均增速超过30%,力规模排名全球第二。全国在用超大型、大型数据中心超过450个,中心超过20个。 联想依靠自身在温水水冷服务器和异构服务器的深入布局,帮助紫金云大数据中心打造了“东数西”工程启动后甘肃首个落地的项目——紫金云高性能计算平台,为紫金云搭建了高性能计算平台的系统、存储、网络、登录管理系统 向高效绿色发展张云明表示,工信部着力构建以新一代信息通信网络为基础,以数据和力设施为核心,以融合基础设施为重点的新型信息基础设施体系,加快力规划制定,加强力核心技术攻关,促进力资源供需对接,培育力新产业

    56920编辑于 2022-08-15
  • 来自专栏IT创事记

    南京中心:力枢纽节点新标杆

    从某种意义上讲,中心不只是称呼上的改变,更是应对AI时代力爆炸性增长的实质性突破,新标杆的示范效应值得期待。 该来的总会来。 如果说新基建将外延扩展至中心,是力供给侧改革的序曲;那么《三年行动计划》则是层次清晰的组合乐章,推动力供给侧改革向纵深挺进。 类似南京中心这样的力枢纽节点,借助生产、聚合、调度和释放四大关键作业环节,可以提供人工智能全链条所需的力服务。 在聚合算力层面,基于智能网络和存储技术,采用200G IB芯片间高速互联网络,搭配全闪超高速存储系统。 生态强化聚集效应 力枢纽不仅是力上下腾挪的中转站,更是催生人工智能良性生态的孵化台。

    1.7K30编辑于 2022-08-30
  • 来自专栏智算中心网络

    动态WCMP+Flowlet ALB:双引擎驱动网络负载均衡

    人工智能(AI),特别是大规模模型训练和推理,正以前所未有的方式重塑数据中心网络。传统的“尽力而为”网络架构,在处理海量、突发的AI数据洪流时捉襟见肘。 AI模型对网络性能的严苛要求——高带宽、低延迟、零丢包——迫使网络必须进行一场深刻的智能进化,从被动的基础设施转变为理解业务、感知状态、智能决策的“AI感知网络”。 AI时代的网络已不再是简单的连通管道。RoCE交换机所代表的动态感知 + 智能决策(动态WCMP) + 精准执行(Flowlet ALB) 架构,标志着网络向“AI感知网络”的深刻进化。 这种进化以保障AI业务性能为核心目标,通过实时感知网络状态、智能评估路径质量、动态调整流量分布,有效化解了传统网络在AI负载下的性能瓶颈,为大规模AI训练和推理提供了稳定、高效、无损的网络基石,释放AI 网络的智能化之路,才刚刚开始。

    55710编辑于 2025-06-20
  • 来自专栏腾讯专有云

    TCE云套件荣获高效能云创新先锋奖

    大会聚焦于崛起、赋能协同、力新十年等行业热点话题展开了深入探讨。 在大会AI力建设系列分论坛演讲环节,腾讯专有云TCE产品负责人丛磊发表了《新趋势下,打造自主可控的全栈云平台》主题演讲,重点阐述了腾讯专有云TCE在建设方面的产品布局及成果。 腾讯专有云TCE云套件,基于公有云的产品能力,在私有云场景下输出腾讯云高性能计算集群HCC、智能高性能网络IHN星脉、高性能并行文件存储TurboFS、力加速框架Taco以及GPU力共享技术等核心能力 ,支撑企业搭建高性能云,解决客户本地化、数据安全、数据隐私等诉求。 无论您是想组建大型中心来承接公共力服务,还是希望通过行业云来赋能上下游行业,套件强大的行业云能力都能轻松实现。

    47710编辑于 2025-02-05
  • 来自专栏星融元

    深度剖析:AI中心网络流量与数据存储技术

    本篇为“揭秘AI中心网络流量“系列的第三篇,前篇请参阅:一文揭秘AI中心网络流量-大模型训练篇一文揭秘AI中心网络流量-AI推理篇01、生成式AI对数据存储有哪些需求? 02、中心的存储网络我们大致可将AI中心内部的数据存储系统进行简单的层次分类,主要包括GPU内存、存储网和存储设备。一般来说,在存储层次结构中位置越高,其存储性能(尤其是延迟)就越快。 因为本文的定位在分析网络流量,我们将聚焦于存储网络(data fabric)层次,即中心内部GPU服务器内存与远端存储服务器之间传输的数据。 CX664P-N 是一款专为/超中心设计的超低时延RoCE交换机,凭借以下特性在存储场景中脱颖而出。 搭载持续进化的企业级SONiC——AsterNOS网络操作系统,其开放的软件架构通过REST API开放全部网络功能给AI中心管理系统,实现无损以太网的自动化极简部署 → Easy RoCE:一键启用无损以太网除存储网之外

    1.4K10编辑于 2024-08-07
  • 来自专栏星融元

    AI中心,大模型训练背后的网络流量“奥秘”

    虽然为了加速训练,也会采用多块GPU同时训练,但所有的I/O均发生在一台AI服务器内部,并不需要网络I/O。 AI大模型训练的网络流量有哪些? 并行训练:AI中心的主要流量来源 当前广泛应用于AI训练并行计算模式主要有以下三类: 并行计算模式 详情 数据并行 将不同的样本数据分配给不同的GPU,以加快训练速度;用在主机之间 张量并行 将模型的参数矩阵划分为子矩阵 计算可得每个epoch过程中: 反向传播总网络流量(PB) 反向传播同步次数 前向过程总网络流量(PB) 前向过程总网络流量 数据并行 1396 PB 1 0 0 FSDP 175 80 175 80 在模型并行、流水线并行和数据并行三个维度上都存在网络流量。接下来我们将深入到每个epoch的训练过程,分别计算不同阶段的网络流量组成和规模。 AI训练对中心网络的要求 通过以上分析和计算,我们可以得出一个典型的AI中心对计算网的核心需求。 超高带宽:一个epoch就会产生85EB的数据量,相当于整个互联网2.5天的流量。

    1.7K10编辑于 2024-08-06
  • 来自专栏编程教程

    国内代理IP:网络时代的隐形基础设施

    在万物互联的时代,数据流动如同人体血液循环,而代理IP技术正是这场数字洪流中的"血管网络"。 这种"变形金钢"式的能力,使得代理IP成为时代不可或缺的基础设施。 二、时代的五大应用场景 在智能计算的浪潮中,代理IP技术正在深度渗透关键领域: 数据采集: 网络爬虫通过代理IP构建分布式采集矩阵,某舆情监测平台日均处理数据量达50TB。 四、未来进化方向 在网络时代,代理IP技术正在呈现三大进化趋势: 智能化: 基于强化学习的动态决策引擎,可根据网络环境自动优化代理策略。 五、结语:构建数字信任的基石 代理IP技术并非简单的"网络面具",而是时代的基础设施升级。它像电力网络中的变压器,像交通系统中的立交桥,正在悄然重塑数字世界的运行规则。

    57110编辑于 2025-08-28
  • 来自专栏智算中心网络

    破解哈希极化:基于主动路径规划的网络负载均衡方案

    如今人工智能(AI)和大模型训练的蓬勃发展,大规模AI力集群(集群)已成为关键基础设施。这类集群对网络性能,特别是高吞吐、低延迟和无损特性有着严苛要求,RoCE因此被广泛应用。 应对集群哈希极化:主动路径规划(PPD)配置方案在支撑大规模AI力()集群的网络架构中,Clos架构因其高扩展性和冗余性被广泛采用。 这种不均衡会显著拖慢集群的整体性能,成为规模化部署的痛点。什么是哈希极化?哈希极化(也称哈希不均),其根本原因在于哈希算法的一致性与网络拓扑结构及流量模式特性之间的复杂相互作用。 设计考量: 在典型的“轨道”(POD)组网中,大部分流量局限于轨道内部传输,跨轨道流量比例较小。因此,网络方案可优先解决Leaf层极化问题,Spine层拥塞风险暂不作为主要考量。3. EasyRoCE Toolkit 简介:基于开源、开放的网络架构与技术,专为AI、超等场景的RoCE网络设计,提供一键配置RoCE、高精度流量监控、主动路径规划(PPD)等一系列实用特性与工具,显著简化高性能网络部署与管理

    50010编辑于 2025-07-21
  • 来自专栏计算机工具

    力互联网网络架构;SRV6;享WAN

    力互联网网络架构 为构建力互联网这个前瞻性的数字基础设施,确保各类力资源能够无缝、智能且高效地联接成一张网络,需达成以下关键目标: ●力高效互联:将分散的力资源池整合,通过统一调度平台提升力使用效率 ●广泛接入覆盖:确保各级资源池和海量用户无缝接入,实现力资源的按需调度和服务。 ●智能流量调度:识别并灵活调度不同类别、不同需求流量,优化网络资源利用,提升网络质量。 以下是对享WAN的详细解释: 一、定义与背景 享WAN是中国移动为应对新业务、新需求层出不穷的云时代,提出的一种整合云、边、端、网资源,提供端到端服务及动态调整能力的新型网络解决方案。 网络感知应用与力:享WAN能够感知应用需求和网络力资源,提供基于应用的服务和基于力资源的选路服务,实现面向力的网络优化调度。 面向未来网络的可持续发展,800G与1.6T网络速率正加快研发,智能力的应用范围将持续拓展,力与网络的融合将更加深入,安全和绿色低碳将是网络发展的永恒主题 智能网络成为智能经济时代代表性数字基础设施

    1.2K10编辑于 2024-12-14
  • 驱代码:飞 JavaAI 探秘

    前言 本博客将深度记录我使用飞 JavaAI 插件从注册、功能测试到实战开发的全过程。通过大量截图、生成代码片段与实战效果演示,我将与你分享 AI 驱动下的 Java 开发革新时代。 飞介绍 飞JAVA AI 开发助手是飞算数科技(深圳)有限公司自主研发的智能开发工具,它将人工智能与 Java 技术相结合,旨在助力企业实现科技化、数字化、智能化转型升级。 注册与登录 重启后,IDEA 右侧会出现“飞JavaAI”面板,点击登录。 快速上手:第一次使用 登录成功后,点击“Java chat”进入交互式对话界面 。 对应位置也能点击飞小图标也能生成对应的代码注释。 因为对应的部分配置没有完成,小编就不展示了。 功能全面测评 1. 无论你是刚入门的新手还是需要事半功倍的资深开发者,飞 JavaAI 都值得一试。

    39210编辑于 2025-12-21
  • 来自专栏IT创事记

    原生世界的力再造

    他认为,云原生将赋予企业和组织与生俱来的云与智能的架构和能力,加速释放数据价值,推动企业向数字原生组织演进。 “原生”世界的力危机 前景虽然美好,但道路并不平坦。 新华三集团计算存储产品线副总裁、智慧计算产品线副总经理刘宏程深谙力产生与流转之道,他以“、劲、稳、迅”来概括新华三服务器的独特优势。 :在计算产品中融合了CPU、GPU、FPGA等多元力,利用全栈智能架构,让智能融入IaaS管理、PaaS平台层和应用层。 新华三服务器采用业界最先进的GPU,使得AI力提升高达20倍。针对高性能计算场景,由于CPU、GPU力和网络IO的增长,相较于上一代高性能计算集群,效率可提升至250%。 其中,自主研发的高性能智能网络处理器“擎”,是业界第一款由系统厂商推出、具备高级语言编程能力的网络处理器;智能终端领域则推出了云屏MagicHub以及商用笔记本、台式机、显示器等产品——赋予企业数字化转型所需的全栈

    1.3K10编辑于 2022-08-30
  • 来自专栏智算中心网络

    自动化+可视化的中心多租户网络配置工具

    然而,资源共享也给网络带来了更多挑战:数据隔离:确保租户间数据不可见性能保障:避免资源争抢导致的性能干扰安全风险:防范跨租户攻击运维复杂度:管理大规模虚拟化网络解决这些问题的关键在于:将物理网络资源虚拟化 多租户网络的实现基石Underlay 物理网络为了支撑上层虚拟化网络的需求,Underlay 网络普遍采用高性能的路由协议(如 BGP)进行互联互通,并常以 Spine-Leaf 架构进行组网设计。 它隶属于EasyRoCE Toolkit ,专为云计算、 AI 、超等场景的 RoCE 网络设计,提供一键配置、高精度监控等特性。 网络设计规划首先是必不可少的网络规划,这一步需由工程师基于实际业务需求设计逻辑隔离,一般是采用 VLAN、VXLAN 技术划分虚拟网络,规划 IP 地址池及子网,避免地址冲突。 多租户网络是云计算、资源高效利用与安全隔离的核心支撑。

    37510编辑于 2025-08-22
  • 来自专栏智算中心网络

    IB vs RoCE:梳理AI网络的负载均衡与流控方案

    然而,随着大模型规模的不断扩大和训练需求的增加,网络面临的挑战也日益严峻。网络作为连接计算集群的重要基础设施,其性能直接影响着AI训练的效率和效果。 网络的主流架构目前网络的领域的两大主流架构:InfiniBand 和RoCEv2 在性能、成本、通用性等多个关键维度上展现出各自的优势,相互竞争。 我们将细致分析这两种架构的技术特性、它们在 AI 网络中的应用场景,以及各自的优势和局限性。 网络中的负载均衡与流量控制AI大模型时代下,数据中心与网络,如Spine-Leaf架构,拓扑规整,选路简易。 就网络流量模式而言,GPU服务器间常存在多条并行路径,如Fat tree网络中会有数十条。如何在这些路径中实现负载均衡路由,成为中心路由设计的核心挑战。

    2K21编辑于 2025-04-17
  • OpenClaw配置白山GLM-5

    参考如图配置白山api 展开 openclaw.json中primary后重新gateway /models  配置contextWindow和maxTokens参考谱的参数进行配置修改 rm -rf ~/.openclaw/extensions/feishu 问题:添加白山模型

    2.6K40编辑于 2026-03-09
  • 来自专栏云深知网络 可编程P4君

    新一代中心网络技术白皮书(附下载)

    为应对上述系列挑战,推动国内产业生态健康、长远发展,中国移动针对性地打造了技术架构、评估评测标准以及生态体系。 新一代中心网络技术白皮书“:前言 2022 年 2 月 18 日,国家正式启动“东数西”工程,突显了数字经济在国家发展中的战略地位。 本白皮书主要研究中心发展情况、中心网络发展趋势以及满足中心发展需求的中心网络关键技术,希望通过在超大规模网络关键技术、超高性能网络关键技术、超高可靠网络关键技术以及网络智能化关键技术等方面的探索 ,为未来面向中心的新型网络架构提供参考。 新一代中心网络技术白皮书:目录 对新一代中心网络技术白皮书感兴趣的同学点赞和在看后,在公众号后台回复“tooyum31”可以获取下载地址。

    2.5K81编辑于 2023-03-06
  • 来自专栏Dance with GenAI

    白皮书:中心光电协同交换网络全栈技术

    中心光电协同交换网络全栈技术白皮书》(2025 年 8 月,由湖南大学、中国联通研究院等多单位联合编写)指出,在 AI 大模型参数量指数级增长推动需求爆发的背景下,传统纯电交换网络因在端口密度 、带宽、时延、功耗上逼近极限,难以满足大规模分布式训练需求,而光电协同交换网络凭借光交换的TB 级带宽、纳秒级时延、低功耗与电交换的灵活控制能力形成互补,成为新一代中心网络核心方向;白皮书系统分析了该网络在应用层 支撑与时间:编写于 2025 年 8 月,得到国家自然科学基金项目(编号:U24B20150)支持,旨在为中心网络领域提供系统参考框架。 二、中心发展与光电协同网络兴起 (1)国家政策推动 2025 年 1 月:《国家数据基础 设施建设指引》强调 “高效弹性传输网络” 对大模型训推的支撑作用,要求提升数据交换性能、降低传输成本。 现阶段使用光电协同方案组建中心网络,以结合光域的高速传输和电域的灵活控制,是更为实际的方案。

    78110编辑于 2025-09-30
  • 来自专栏IT杂谈学习

    丹摩:新手入门指南

    DAMODEL(丹摩)作为一个专为AI打造的云平台,提供了丰富的力资源和便捷的操作界面,极大地降低了AI技术的应用门槛。 一、实例的创建与使用 1.1 创建实例 要开始使用丹摩平台,首先需要创建一个实例。实例是平台提供的一种计算资源,包括CPU、GPU等硬件资源。 登录丹摩平台,进入控制台。 二、本地连接方法 2.1 获取实例的SSH访问信息 要通过本地计算机连接到丹摩平台的实例,首先需要获取SSH访问信息。 在丹摩控制台复制SSH访问链接,获取主机(host)和端口号。 三、总结 丹摩平台为用户提供了一个高效、灵活的AI开发环境。无论是数据科学家、机器学习工程师还是AI爱好者,都可以在丹摩平台上找到适合自己的工具和资源,推动AI项目的发展。 随着技术的不断进步,丹摩将继续优化其平台功能,提供更多的力资源和技术支持,帮助用户更好地实现AI应用的开发和部署。

    90710编辑于 2024-09-25
  • 来自专栏机器之心

    亚洲最大AI超,商汤中心AIDC今天启动运营

    去年底商汤科技上市时,其招股书中披露的人工智能力中心吸引了人们的注意:这家公司在上海临港建设的 AI 力基础设施投资 56 亿元,在去年 2 月仅花费 168 天就迅速宣布建筑物结顶,刷新了临港建设的新纪录 目前国内已知最大的人工智能的力中心是鹏城实验室的「鹏城云脑 II」,输出 1000 Petaflops 力。商汤 AIDC 的力,每天可处理时长 23600 年的视频。 商汤联合创始人、副总裁杨帆表示:「相较于传统网络基础设施 IDC,AIDC 就像是品牌专营店,使用者面向产业智能化、城市智慧化、AI for science,服务更加接近实体产业。 在互联网数据中心 IDC 提供的网络、硬件环境基础上,商汤的 AIDC 围绕人工智能技术,可为全行业提供更全面的服务能力,更多帮助实体行业实现智能化升级。 商汤科技联合创始人、副总裁杨帆。 除了应用范围之外,商汤的基础设施也很有技术含量:从投资 / 力之比上来看,AIDC 的效率要比此前类似的商用 AI 力提升了几倍。商汤表示,AIDC 在建设过程中还会帮助国产硬件更大规模地使用。

    1.6K20编辑于 2022-02-23
领券