我有一个存储集群,它已经运行了几年。它是基于一个漂亮的股票CentOS7.6设置,使用beegfs。
为了提高吞吐量,我决定对网络进行测试升级,从10G升级到40G。但是,这个40G卡所需的驱动程序在内核模块方面似乎与beegfs冲突。现在我已经成功运行了40gig网络,beegfs-client无法启动:
modprobe: ERROR: could not insert 'beegfs': Unknown symbol in module, or unknown parameter (see dmesg)我该怎么让这两个人相处?
我安装的所有卡都是ConnectX-3FDRInfiniband(不过,这两个端口都配置为以太网)。我安装的驱动程序是MLNX_OFED_LINUX-5.0-2.1.8.0-rhel7.6-x86_64。卸载驱动程序没有解决问题,但40G网络仍在工作。它只需要记录端口到以太网,而不是Infiniband。
更新:从外观上看,需要将infiniband支持添加到beegfs-client-autobuild.conf中。不完全确定在哪里可以找到我需要参考的来源。
发布于 2022-03-14 12:07:16
结果,答案比预期的要简单:升级到beegfs-client的最新版本。新版本默认包括infiniband兼容性。不需要重建。
升级和重新启动之后,集群再次按预期运行,Mellanox 40 an /s卡运行。
https://stackoverflow.com/questions/71393072
复制相似问题