我在以下机器上新安装了ofed-1.5-3:
SUSE Linux Enterprise Server 11 (x86_64)版本= 11 PATCHLEVEL =1
我们的管理员已经在机器上安装了MCX354A- CX354A卡。$ lspci | grep -i mel 04:00.0网络控制器: Mellanox Technologies Device 1003
(问题1:我不知道lspci的输出是否正确,但我怀疑是正确的,但不知道如何获得正确的输出。)
在我通过./mlnxofedinstall脚本安装ofed包之后:
ofed_info | head -1 : MLNX_OFED_LINUX-1.5.3-3.1.0 (OFED-1.5.3-3.1.0)输出:
安装成功,openibd加载了所有需要的模块/驱动程序。$ service openibd状态
已加载HCA驱动程序
已配置的IPoIB设备: ib0 ib1
当前活动的IPoIB设备:
加载以下OFED模块:
rdma_ucm ib_srp rdma_cm ib_addr ib_ipoib mlx4_core mlx4_ib mlx4_en ib_mthca ib_uverbs ib_umad ib_ucm ib_sa ib_cm ib_mad ib_core iw_cxgb3 iw_nes
hca_self_test.ofed的输出
-执行适配器设备自检-检测到的CA数.............1 PCI设备检查.......................PASS Kernel Arch ............................x86_64主机驱动程序版本....................MLNX_OFED_LINUX-1.5.3-3.1.0 (OFED-1.5.3-3.1.0):2.6.32.12-0.7-默认主机驱动程序RPM检查..................在CA #0 VPI上传递固件..................v2.10.700检查CA #0 (VPI)上的固件..........NA原因:不需要固件版本主机驱动程序初始化.............传递活动的CA端口数.............0 CA #0 (VPI)上端口#1的端口状态.....CA #0上端口#2的关闭(InfiniBand)端口状态(VPI).....CA #0 (VPI)上的DOWN (InfiniBand)错误计数器检查......通过内核系统日志检查....................在CA #0 (VPI)上传递节点GUID ...............00:02:c9:03:00:f9:ed:e0
问题2:现在,当我尝试ibstatus或ibv_devinfo时,我看到端口状态为PORT_DOWN。而我在文档中读到的是它应该处于INIT状态。我的问题是如何将其转换为INIT状态。$ ibv_devinfo
hca_id: mlx4_0传输: InfiniBand (0) fw_ver: 2.10.700 node_guid: 0002:c903:00f9:ede0 sys_image_guid: 0002:c903:00f9:ede3 vendor_id:0x02c9 vendor_part_id: 4099 hw_ver: 0x0 board_id: MT_1090120019 phys_port_cnt: 2端口:1状态:PORT_DOWN (1) max_mtu: 2048 (4) active_mtu: 2048 (4) sm_lid: 0 port_lid: 0port_lmc: 0x00 link_layer: IB
port: 2
state: PORT_DOWN (1)
max_mtu: 2048 (4)
active_mtu: 2048 (4)
sm_lid: 0
port_lid: 0
port_lmc: 0x00
link_layer: IB当我尝试执行以下命令时,我得到了错误:
$ ibportstate -G 0x0002c90300f9ede0 1查询/启用/禁用ibwarn: 9318 mad_rpc_open_port:无法打开UMAD端口((null):0) ibportstate: iberror:失败:无法打开'(null)‘端口'0’
问题3:我不明白为什么会出现这个错误,或者我如何摆脱它。任何帮助都将不胜感激。
如果您需要更多信息,请让我知道。
谢谢
发布于 2012-10-12 17:23:01
在您使用infiniband电缆将此节点连接到另一个节点或infiniband交换机之前,ibv_devinfo中的端口状态将为down。从模块上看,您似乎已经完成了所有必要的设置,只是缺少了另一个要与之对话的节点。一旦您将其连接到另一个节点,您应该能够看到状态更改为PORT_INIT和链路速度等填充。
https://stackoverflow.com/questions/12457968
复制相似问题