首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏cuijianzhe

    IB网卡流量带宽监控

    ib_list = [] for key in Result_str: ib_list += [{'{#IBNAME}':key}] print(json.dumps({ 'data':ib_list},sort_keys=True,indent=4,separators=(',',':'))) def net_traffic_List(ib_name): CMD ,/usr/bin/python3 /etc/zabbix/externalscripts/ib_network_discovery.py IB_network_discovery UserParameter =ib_network.get[*],/usr/bin/python3 /etc/zabbix/externalscripts/ib_network_discovery.py  net_traffic_total $1 UserParameter=ib_network.rx[*],cat /etc/zabbix/externalscripts/$1 | head -n 1 UserParameter=ib_network.tx

    3.1K20编辑于 2023-11-19
  • 来自专栏DPU

    RDMA的内存管理(IB内核管理用户态内存) - ib_umem

    RDMA的内存管理(IB内核管理用户态内存) - ib_umem简介从内核模块暴露IB内存接口: ib_umem_get()/ib_umem_release() ,可让低级驱动程序控制何时调用 ib_umem_get 还将这些函数移至 ib_core 模块而不是 ib_uverbs 中,以便使用它们的驱动程序模块不依赖于 ib_uverbs。 region = ib_umem_get -> pin住以及通过DMA映射的用户空间内存, IB/uverbs:将 ib_umem_get()/ib_umem_release() 导出到模块,导出 ib_umem_get 还将这些函数移至 ib_core 模块而不是 ib_uverbs 中,以便使用它们的驱动程序模块不依赖于 ib_uverbs。 实现私有通道操作,并注册网络通知程序 irdma_hwreg_mr(iwdev, iwmr, access) -> 发送cqp命令进行内存注册 irdma_alloc_and_get_cqp_request

    1K10编辑于 2024-11-17
  • 来自专栏智算中心网络

    IB vs RoCE:梳理AI智算网络的负载均衡与流控方案

    然而,随着大模型规模的不断扩大和训练需求的增加,智算网络面临的挑战也日益严峻。网络作为连接计算集群的重要基础设施,其性能直接影响着AI训练的效率和效果。 RoCEv1作为链路协议层,要求通信双方位于同一二层网络内。而RoCEv2 则为网络层协议,它采用以太网网络层和 UDP 传输层,取代了 InfiniBand 的网络层,从而提供了更为优秀的可扩展性。 智算网络中的负载均衡与流量控制AI大模型时代下,数据中心与智算网络,如Spine-Leaf架构,拓扑规整,选路简易。 InfiniBand网络的负载均衡和流控机制InfiniBand网络通过多层次技术协同,实现了高效的数据传输与资源管理。 UFM实现零配置(按端口收费)手工配置、或基于开放网络技术实现的 EasyRoCERoCE还是IB

    2K21编辑于 2025-04-17
  • 来自专栏山河已无恙

    Linux 环境下 IB(InfiniBand) 组网认知

    用通俗的话讲,把以太网想象成一个快递包裹分发网络(路由寻址);而IB网络,则可以想象成一个地铁轨道交通网络IB网络 IB网络 你可以想象成一个地铁轨道交通网络。这是因为IB的底层是基于VCT(Virtual Cut Through)技术。 IB网络是直接然后再在过每个中转站的时候,车屁股还没进站,车头已经向下一站出发了!所以它的延迟才能做到这么低。 并且,也如同轨道交通网络一样,这些中转站(交换机)之所以能做到这么快的让车辆通过,是因为目的地车站是确定且有限的(IB网络的地址数量,称为LID号,是有限的,地址空间65535个),所有列车怎么走在网络开始运行前都提前决定好了 相比之下,传统以太网应用架构中,应用程序并不直接访问网络。 换句话我们可以讲,从上到下在链路层开始,IB 组网和 IP 组网就不同了。

    4K21编辑于 2024-04-26
  • 来自专栏cuijianzhe

    修改服务器IB卡工作模式

    1f:00.0 set LINK_TYPE_P1=2 mstconfig -d 1f:00.0 q 可以查看设备信息,包括设备工作运行的模式(LINK_TYPE_P); ‍ 标题:修改服务器IB

    2.1K11编辑于 2023-11-25
  • 来自专栏存储公众号:王知鱼

    IB领跑的计算网,UEC能否破局?

    按:昨天整理了UALink(vs NVLink)最新进展,作为片上互联技术,其传输效率要求最高;而集群(Pod)间互联技术,同样也存在竞争,即超以太网UE,对标NV的IB网络。 问题意识:AI 与 网络 AI用于网络,还是网络用于AI? • 许多文章/博客讨论了AI如何改变网络基础设施 • ...但你需要什么样的网络基础设施才能拥有足够的AI来改变网络基础设施? 节点间的Scale-Out互联网络,目前有IB/RoCE 方案,超以太网(UE)是基于Ethernet的基础设施; 4. 其他标准网络,如系统中的业务网、存储网、管理网等,通常基于百G内以太网。 网络可视性:通过端到端遥测技术提供增强的网络可视性,有助于更好地监控和管理网络性能。 传统RDMA网络与超以太网比较。 AI基础设施工作负载特征,推导其对高速网络的性能需求。 2. 区分集群网络,划分为:加速计算xPU的Scale-Up网络、节点间的Scale-Out互联网络、其他标准网络,指出每部分网络的特征。

    42400编辑于 2025-02-11
  • 来自专栏云深知网络 可编程P4君

    聚众群殴 IB 网络,超以太网联盟携 45 名新成员走向 v1.0 规范!

    此外,网络在功耗和总体 TCO 中的占比持续上升,因此对 UEC 网络技术的不大投资将带来快速的投资回报。 这种细粒度的负载平衡可以提高网络利用率并减少尾部延迟。 拥塞处理:大规模人工智能集群和 HPC 网络具有独特的流量模式,特别是在加速卡的网络速度和带宽不断增加的情况下,需要对传统数据中心网络拥塞处理进行重大改进。 AllReduce 和 All-to-All 等基础集合的网络优化对于减少作业完成时间至关重要。为了给这些集合提供最高的网络性能,基于多路径协调的拥塞控制对于指导数据包喷发至关重要。 有损和无损网络:虽然 UET 在有损网络上提供出色的性能,利用多路径和网络遥测辅助下的改进拥塞控制,它也可设计在无损网络上运行。

    1.2K10编辑于 2024-03-22
  • 来自专栏iOS开发随笔

    iOS IB Designable Errors Failed to update auto layout status:……

    ,然后install 和 update 一下就没事了 原文链接:https://stackoverflow.com/questions/28204108/ib-designables-failed-to-update-auto-layout-status-failed-to-load-designables

    97530发布于 2018-07-04
  • 来自专栏DPU

    RDMA - IB规范卷1 - 传输层2(可靠服务)

    接上文: RDMA - IB规范卷1 - 传输层(概述-基本传输头-扩展头-功能-保序-包头校验), https://cloud.tencent.com/developer/article/2513460 例如,在某些拥塞的网络结构情况下,当预期 RDMA READ 或 Atomic 响应时,可能会收到 ACK。即使响应数据包中包含的 PSN 与请求方预期的响应 PSN 匹配,也可能发生这种情况。 未完, 下一篇(9.7.8 可靠数据报): https://cloud.tencent.com/developer/article/2516321 参考 IB Spec1.6 卷1第9章

    1.6K10编辑于 2025-04-26
  • 来自专栏星融元

    层级剖析:RoCE与IB协议栈的选择策略(一)

    RoCE与IB网络架构概述RoCE和InfiniBand均是InfiniBand Trade Association(IBTA)定义的网络协议栈,其中Infiniband是一种专为RDMA设计的高性能网络 RoCE与IB网络层级对比IB与RoCE协议栈在传输层以上是相同的,在链路层与网络层有所区别:RoCEv1中,以太网替代了IB的链路层(交换机需要支持PFC等流控技术,在物理层保证可靠传输),然而,由于 网络层级对比小结在物理层,RoCE和IB都支持800G,但PAM4相比NRZ具有更强的升级潜力,以太网成本也低于IB,RoCE更胜一筹。 在网络层,RoCE借助IP的成熟的持续发展,更能适应大规模网络。传输层及以上,RoCE和IB使用同样的协议,没有区别。 RoCE实际上是将成熟的IB传输层和RDMA移植到了同样成熟的以太网和IP网络上,是一种强强联合,在保持高性能的同时,降低了RDMA网络的成本,能够适应更大规模的网络

    4.2K12编辑于 2024-11-07
  • 来自专栏星融元

    功能应用:RoCE与IB协议栈的选择策略(二)

    本文我们将继续分析RoCE和IB在拥塞控制、QoS、ECMP三个关键功能中的性能表现。拥塞控制拥塞控制即用来减少丢包或者拥塞传播,是传输层的主要功能,但需要借助链路层和网络层的帮助。 RoCEv2 的拥塞控制机制RoCEv2通过链路层PFC、网络层ECN、传输层DCQCN三者协同配合,实现更高效的拥塞管理,可见,RoCEv2虽然使用了IB的传输层协议,但在拥塞控制方面有所不同。 在网络层,IB的GRH支持8个bit的Traffic Class字段,用于在跨子网的时候提供不同的优先级,但同样无法保证带宽。 InfiniBand的ECMP在控制平面,IB的路由基于子网管理器,在拓扑发现的基础上实现ECMP,但由于集中式的子网管理器与网络设备分离,可能无法及时感知网络拓扑的变化,进而实现动态的负载均衡。 总结来看,IB具备已验证的高性能和低延时优势,RoCEv2则在互操作性、开放性、成本效益方面更胜一筹,且从市场占比及认可度来看,RoCEv2逐渐比肩IB;但不得不承认的是,RoCE和IB在应对大规模AI

    1.4K11编辑于 2024-11-07
  • 来自专栏微星极光

    InnoDB: .ib_logfile0 cant be opened in read-write mode

    /ib_logfile0 can't be opened in read-write mode 背景 昨天重启了macbook之后,今天跑开发, 发现本地mysql连不上, 报错如下 2020-05-10T09 /ib_logfile0 can't be opened in read-write mode. 2020-05-10T09:18:05.510492Z 0 [ERROR] InnoDB: Plugin builtin plugins. 2020-05-10T09:18:05.822627Z 0 [ERROR] Aborting 解决方案 进入/usr/local/var/mysql/ 目录, 删除ib_logfile0 文件, rm -rf /usr/local/var/mysql/ib_logfile0 重启mysqld搞定 原文链接 https://www.wxhmf.com/posts/mysql-failed-to-start-on-mac-due-to-innnodb-libdata1

    1.9K00发布于 2020-05-10
  • 来自专栏SAP供应链

    SAP PM 入门系列17 - IB03 显示设备BOM

    SAP PM 入门系列17 - IB03 显示设备BOM 1,SAP PM模块里的BOM. material can be created for each piece of equipment or for a group of technical objects. 3, 使用事务代码IB03 BOM usage用4(plant maintenance).输入设备号,工厂代码,bom usage,回车, 看这个设备BOM的header数据, 如下方式可以查到BOM的变更记录, 系统切换到IB80

    70640发布于 2021-01-15
  • 来自专栏iOSDevLog

    IB Designables: Failed to render and update auto layout status forhttps:github.comCocoaPodsCocoa

    https://www.raywenderlich.com/156971/cocoapods-tutorial-swift-getting-started

    1K30发布于 2018-07-25
  • 来自专栏Postgresql源码分析

    为什么ib_logfile被覆盖Mysql还能正常运行!?

    ib_logfile0和ib_logfile1被覆盖但是mysql还在正常运行,复现问题记录排查流程,涉及文件系统的一些知识点。 /u01/database/data/ | grep delete 查看FD:stat /proc/23141/fd/4 复现问题 docker1新建空实例,删除后docker1还可以正常使用 rm ib_logfile0 rm ib_logfile1 问题排查 1 为什么文件被删除了还能正常运行 在linux中,每个文件都有两个 link 计数器: i_count:文件使用者或者被调用的数量,理解为内存引用的计数器。 案例中的 ib_logfile[*]由于没有新创建硬链接,所以 i_nlink = 1,加上此时 3306实例处于运行中,需要调用 到 ib_logfile[*]文件,所以 i_count = 1( 当前无其他进程使用到 ib_logfile[*] ),当文件被删除的时候,i_nlink =0 但是 i_count=0,故文件不会被真正删除,仅删除 inode 连接,并没有删除 磁盘的数据块。

    75430编辑于 2022-05-12
  • 来自专栏冰霜之地

    关于IB_DESIGNABLE IBInspectable的那些需要注意的事

    前言 IB_DESIGNABLE / IBInspectable 这两个关键字是在WWDC 2014年"What's New in Interface Builder"这个Session里面,用Swift 这里需要提一下IB_DESIGNABLE的工作原理。 总结 当我第一次知道IB_DESIGNABLE / IBInspectable之后,感觉到特别的神奇,连我们自定义化的View也可以及时可见了。不过经过一段研究以后就发现。 IB_DESIGNABLE / IBInspectable还是有一些缺陷的。IB_DESIGNABLE暂时只能在UIView的子类中用,常用的UIButton加圆角这些暂时也没法预览。 以上就是我和大家分享的IB_DESIGNABLE / IBInspectable使用过程中遇到的一些“坑”。

    2K30发布于 2018-08-30
  • 来自专栏DPU

    RDMA - IB规范卷1 - 传输层3_不可靠服务

    数据包有效载荷可以包含由 IETF 对 IPv6 报头的“下一个报头”字段编码定义的任何传输或网络协议,但不包括任何指示下一个报头为 IBA 传输报头的编码。 下表总结了两种原始数据报类型的最大数据包有效载荷(以及 LRH PktLen 字段的对应值)参考IB Spec1.6 卷1第9章

    54410编辑于 2025-05-11
  • 来自专栏ATYUN订阅号

    【行业】苹果和IB将通过新的机器学习集成展开合作

    去年在全球开发者大会上推出的Core ML平台工具,可以将训练使用的第三方工具所构建的神经网络模型集成到iOS应用程序中。

    1.3K40发布于 2018-03-27
  • 来自专栏DPU

    RDMA Infiniband - IB通信管理-子网管理(SM)和子网代理(SMA)

    术语 IBA架构层次: 和典型的TCP/IP七层模型不同, IBA从上到下分为5层: verbs接口层/传输层/网络层/链路层/物理层 , 内部网络网络/链路/物理共3层, 简化层级也带来了通信的高效率 子网管理类的MAD称为SMP 简介 通信管理包含用于建立、维护和释放 IB 可靠连接、不可靠连接和可靠数据报传输服务类型的通道的协议和机制。 代理是嵌入在所有通道适配器、交换机和路由器中的低级功能主体的概念,它提供了设置和查询通道适配器、交换机或路由器内部的各种参数的方法 IB管理模型 每个子网至少有一个子网管理器 (SM)。 主 SM 是初始化和配置 IB 子网的关键元素。 主 SM 作为子网初始化过程的一部分被选举出来,并负责以下功能 发现该SM管理子网内的网络拓扑 为子网内所有IB通信端口分配一个公共的子网ID(子网前缀) 为子网内所有IB通信端口分配一个唯一的通信地址

    2.6K00编辑于 2024-06-05
  • 来自专栏DPU

    RDMA - IB规范卷1 - 传输层2(可靠服务-可靠数据报)

    接上篇(RDMA - IB规范卷1 - 传输层2(可靠服务)): https://cloud.tencent.com/developer/article/25163189.7.8 可靠数据报可靠数据报提供可靠的通信 多核处理器的既定趋势直接导致在典型的 IB 连接集群的每个终端节点上运行的进程数量增加。多核节点系统如今非常普遍,并且路线图显示,在不久的将来,每个节点将拥有更多核心。 o9-114.a10:XRC ACK 数据包中的 E2E 信用(MSN 字段)应设置为“无效”参考IB Spec1.6 卷1第9章

    77710编辑于 2025-04-26
领券