我们有一个CentOS服务器运行一个虚拟集群。有时候集群的内部网络会中断一分钟左右.然后回来。这个问题在某种程度上与实际的网络流量有关,但它不是一个简单的负载问题。(系统通常是轻松加载的,无论实际负载如何,都会出现问题。)
设置:
系统有一个外部可见的IP地址,Dom0运行一个Apache,它配置了许多虚拟主机,每个虚拟主机向运行在虚拟服务器上的web服务器反向代理。(虚拟者必须是NAT‘’ed的,主要是因为我们没有足够的公共IP地址。)
症状:
这是100%的重复性。
我们尝试过的是:
我已经用尽了所有的选择除了转到KVM ..。或者屠杀更多的公鸡。
有什么建议吗?
发布于 2012-09-05 14:44:54
我们最终找到了问题所在。结果发现,这是由我们虚拟网络配置中的一个问题引起的。由于某种原因,我再也记不起来了,用于特定下载的网络流量正在通过虚拟网络进行额外的循环。当用户试图上传一个大文件时,下载将关闭所有可用的内核网络缓冲区。导致整个网络冻结..。直到有东西停了下来,一切都结束了。
很抱歉,这一切都有点模糊,但可能会为遇到类似问题的人提供一些提示。
发布于 2011-08-15 02:23:40
也许只有有限的网络线程才能将虚拟服务器连接到主机上,而上传大型文件最终会占用所有这些线程,而其余的则会丢失信号。我没有其他的猜测。抱歉的。
发布于 2011-08-15 08:21:25
您可能会看到内存过度承诺和/或交换配置(S)。如果要么是“调优到刀柄”,那么一个大的文件上传可能会触发对这些资源的管理-导致在管理完成之前无法使用。
https://serverfault.com/questions/301078
复制相似问题