首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Xen DomU的瞬态网络丢失

Xen DomU的瞬态网络丢失
EN

Server Fault用户
提问于 2011-08-15 00:57:35
回答 4查看 746关注 0票数 1

我们有一个CentOS服务器运行一个虚拟集群。有时候集群的内部网络会中断一分钟左右.然后回来。这个问题在某种程度上与实际的网络流量有关,但它不是一个简单的负载问题。(系统通常是轻松加载的,无论实际负载如何,都会出现问题。)

设置:

  • CentOS 5.6在Dom0,各种CentOS在DomU's上
  • 硬件-戴尔R710与BroadCom NextXpress 2 NIC (叹息)
    • 使用来自BroadCom的NIC最新驱动程序

  • Xen配置为使用网桥和vif桥。
  • 一些可停用的调整将一个无关的端口路由到其中一个虚拟端口。

系统有一个外部可见的IP地址,Dom0运行一个Apache,它配置了许多虚拟主机,每个虚拟主机向运行在虚拟服务器上的web服务器反向代理。(虚拟者必须是NAT‘’ed的,主要是因为我们没有足够的公共IP地址。)

症状:

  • 大部分时间都工作得很好。
  • 当有人试图将一个大文件上传给一个虚拟人时,内部网络就会退出.适用于所有虚拟化者:
    • Dom0 httpd看到网络超时与虚拟后端服务器对话,并报告502。
    • 以前建立的从Dom0到DomU的任何冻结的ssh连接。
    • 我们的监视显示了虚拟者之间的通信失败。
    • Xen控制台不能冻结到DomU's。
    • 在我能看到的任何日志文件中都没有日志消息,无论是在Dom0上还是在DomU上.除了Dom0的httpd日志之外。
    • 过了一分钟左右,问题就自行解决了。

这是100%的重复性。

我们尝试过的是:

  • 在BNX2上下载、构建和安装最新的Dom0驱动程序
  • 关闭网卡上的MSI --在/etc/modprobe.conf中添加"options bnx2 disable_msi=1“
  • 关闭tcp分段卸载- "ethtool eth0 tso关闭“。
  • 在午夜牺牲一只黑公鸡。

我已经用尽了所有的选择除了转到KVM ..。或者屠杀更多的公鸡。

有什么建议吗?

EN

回答 4

Server Fault用户

回答已采纳

发布于 2012-09-05 14:44:54

我们最终找到了问题所在。结果发现,这是由我们虚拟网络配置中的一个问题引起的。由于某种原因,我再也记不起来了,用于特定下载的网络流量正在通过虚拟网络进行额外的循环。当用户试图上传一个大文件时,下载将关闭所有可用的内核网络缓冲区。导致整个网络冻结..。直到有东西停了下来,一切都结束了。

很抱歉,这一切都有点模糊,但可能会为遇到类似问题的人提供一些提示。

票数 1
EN

Server Fault用户

发布于 2011-08-15 02:23:40

也许只有有限的网络线程才能将虚拟服务器连接到主机上,而上传大型文件最终会占用所有这些线程,而其余的则会丢失信号。我没有其他的猜测。抱歉的。

票数 0
EN

Server Fault用户

发布于 2011-08-15 08:21:25

您可能会看到内存过度承诺和/或交换配置(S)。如果要么是“调优到刀柄”,那么一个大的文件上传可能会触发对这些资源的管理-导致在管理完成之前无法使用。

票数 0
EN
页面原文内容由Server Fault提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://serverfault.com/questions/301078

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档