首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >没有集群或vm的linux服务器的硬件故障转移?

没有集群或vm的linux服务器的硬件故障转移?
EN

Server Fault用户
提问于 2013-09-24 19:03:20
回答 2查看 280关注 0票数 -4

对于如何在不实现集群或vm的情况下为SLES11安装提供完全故障转移,有什么想法吗?

正在运行的应用程序没有(也永远不会)集群感知。没有传入的客户端连接--这不是一个are服务器。此服务器转换数据并在磁盘上产生输出,同时高速驱动生产打印机(通过1 1GbE、10 1GbE和/或infiniband )。

当前的解决方案是两个相同的服务器,其中一个连接到(并从)外部存储启动。在主服务器故障时,外部存储与故障服务器断开连接,并连接到第二服务器,然后从该存储启动第二服务器。工作正常,除非它不是自动的,如果两台服务器都被连接并打开,操作系统就会被销毁。

一直在寻找一种解决方案,该解决方案允许将两台服务器永久连接到外部存储,并具有某种自动机制,以便在发生故障时从故障服务器中移除电源,并恢复备份服务器的电源。这种“自动机制”不能涉及第三台服务器--这只会增加成本和复杂性。

集群不会工作,因为许可不允许这些应用程序“移动”,而且不管任何人说什么,集群并不简单,它们需要一个专用的管理员来监视--您不能在客户位置安装一个,只需离开(尝试在200个客户位置支持这个功能)。VM不会工作,因为需要专用的nics与输出设备进行通信(所以没有vmotion),加上15%-25%的性能命中是不可能的。

服务器是HP Proliant --显然的解决方案是HP在国际劳工组织中实现这一功能,让BIOS监视服务器故障( bios已经可以这样做并被设置为自动重新启动服务器),然后通过劳工组织控制这两台服务器的故障转移能力。也就是说,运行中的服务器检测到故障,劳工组织唤醒故障转移服务器,然后劳工组织从故障服务器中删除电源--如果ilo无法从故障服务器上删除电源,它将关闭故障转移。劳工组织今天不能这样做。甚至没有办法保证这样做会奏效。

另一种可能性(已经实现)需要2台运行许可的服务器,其中包含所有输出数据的镜像--如果第一台服务器出现故障,第二台服务器可以完成输出工作。但这需要两个安装,以两倍的许可成本(许多许多1000美元)。还有别的办法吗?请记住,我正在寻找一种无需使用任何额外服务器的方法来完成此操作。

我已经测试了NEC容错服务器(这是Stratus和Winchester提供的硬件),但它们不支持原生SLES (您必须使用vsphere),而且它们只在内部raid 10磁盘上保持一致性--每个服务器没有足够的驱动器。我目前的解决方案使用外部存储-- HP D2700 (多达8台),每个驱动器有多达252.5英寸的sas驱动器,每台服务器中只有一台电缆(一次只有一个),因为我需要400-500 MB/s顺序读取速度--这就是为什么在这个配置中没有san或nas。

编辑:

让我尽量简化我的问题。

是否有可能将一台SLES11服务器(所有数据、所有应用程序、所有服务)自动故障转移到另一台只有一个O/S可安装和维护的相同服务器(冷备用服务器)。其思想是保持专用硬件提供的性能,但有一个计划,当该硬件(内存,cpu,p/s等)失败了。

如果没有集群、vm、drbd、linux-ha等,这有可能吗?这可以通过直接连接的外部存储(双端口,RAID10)来完成,但是必须有人关闭故障服务器并将电缆移动到故障转移,然后打开它。任何人(没有受过训练)都可以支持这一点。但这不是自动的。

EN

回答 2

Server Fault用户

发布于 2013-09-25 20:48:32

最简单的商业解决方案,以照顾您正在寻找的是SIOS救生员。请参阅:http://us.sios.com

我使用它的情况下,我的应用程序是不知道集群,但需要一定程度的弹性。

SIOS将处理您的贵宾、应用程序启动/故障转移/关机、存储(网络RAID或共享)以及您可能需要的任何自定义脚本。很容易相处。每台服务器大约2美元。

票数 0
EN

Server Fault用户

发布于 2014-01-29 11:15:23

首先,我看不出为什么操作系统应该被“摧毁”。

唯一的问题,你是IMHO面临的是,您将有不同的MAC-嵌入服务器上。

如果它们是相同类型的,具有相同的PCIe时隙分配和网络硬件,则可以很容易地解决这个问题:

udev中的NIC名称绑定从基于MAC的改为基于PCIe的插槽.

在sles 11上更改它的位置是:/etc/udev/rules.d/70-persistent-net.rules

示例-假设ethtool -i eth0返回0000:04:00.0作为PCIe插槽-位置:

代码语言:javascript
复制
SUBSYSTEM=="net", ACTION=="add", DRIVERS=="?*", KERNELS=="0000:04:00.0", ATTR{dev_id}=="0x0", ATTR{type}=="1", KERNEL=="eth*", NAME="eth0"

为此,您不必更改/etc/sysconfig/ not /ifcfg-*中的任何内容。

票数 0
EN
页面原文内容由Server Fault提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://serverfault.com/questions/541373

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档