对于如何在不实现集群或vm的情况下为SLES11安装提供完全故障转移,有什么想法吗?
正在运行的应用程序没有(也永远不会)集群感知。没有传入的客户端连接--这不是一个are服务器。此服务器转换数据并在磁盘上产生输出,同时高速驱动生产打印机(通过1 1GbE、10 1GbE和/或infiniband )。
当前的解决方案是两个相同的服务器,其中一个连接到(并从)外部存储启动。在主服务器故障时,外部存储与故障服务器断开连接,并连接到第二服务器,然后从该存储启动第二服务器。工作正常,除非它不是自动的,如果两台服务器都被连接并打开,操作系统就会被销毁。
一直在寻找一种解决方案,该解决方案允许将两台服务器永久连接到外部存储,并具有某种自动机制,以便在发生故障时从故障服务器中移除电源,并恢复备份服务器的电源。这种“自动机制”不能涉及第三台服务器--这只会增加成本和复杂性。
集群不会工作,因为许可不允许这些应用程序“移动”,而且不管任何人说什么,集群并不简单,它们需要一个专用的管理员来监视--您不能在客户位置安装一个,只需离开(尝试在200个客户位置支持这个功能)。VM不会工作,因为需要专用的nics与输出设备进行通信(所以没有vmotion),加上15%-25%的性能命中是不可能的。
服务器是HP Proliant --显然的解决方案是HP在国际劳工组织中实现这一功能,让BIOS监视服务器故障( bios已经可以这样做并被设置为自动重新启动服务器),然后通过劳工组织控制这两台服务器的故障转移能力。也就是说,运行中的服务器检测到故障,劳工组织唤醒故障转移服务器,然后劳工组织从故障服务器中删除电源--如果ilo无法从故障服务器上删除电源,它将关闭故障转移。劳工组织今天不能这样做。甚至没有办法保证这样做会奏效。
另一种可能性(已经实现)需要2台运行许可的服务器,其中包含所有输出数据的镜像--如果第一台服务器出现故障,第二台服务器可以完成输出工作。但这需要两个安装,以两倍的许可成本(许多许多1000美元)。还有别的办法吗?请记住,我正在寻找一种无需使用任何额外服务器的方法来完成此操作。
我已经测试了NEC容错服务器(这是Stratus和Winchester提供的硬件),但它们不支持原生SLES (您必须使用vsphere),而且它们只在内部raid 10磁盘上保持一致性--每个服务器没有足够的驱动器。我目前的解决方案使用外部存储-- HP D2700 (多达8台),每个驱动器有多达252.5英寸的sas驱动器,每台服务器中只有一台电缆(一次只有一个),因为我需要400-500 MB/s顺序读取速度--这就是为什么在这个配置中没有san或nas。
编辑:
让我尽量简化我的问题。
是否有可能将一台SLES11服务器(所有数据、所有应用程序、所有服务)自动故障转移到另一台只有一个O/S可安装和维护的相同服务器(冷备用服务器)。其思想是保持专用硬件提供的性能,但有一个计划,当该硬件(内存,cpu,p/s等)失败了。
如果没有集群、vm、drbd、linux-ha等,这有可能吗?这可以通过直接连接的外部存储(双端口,RAID10)来完成,但是必须有人关闭故障服务器并将电缆移动到故障转移,然后打开它。任何人(没有受过训练)都可以支持这一点。但这不是自动的。
发布于 2013-09-25 20:48:32
最简单的商业解决方案,以照顾您正在寻找的是SIOS救生员。请参阅:http://us.sios.com
我使用它的情况下,我的应用程序是不知道集群,但需要一定程度的弹性。
SIOS将处理您的贵宾、应用程序启动/故障转移/关机、存储(网络RAID或共享)以及您可能需要的任何自定义脚本。很容易相处。每台服务器大约2美元。
发布于 2014-01-29 11:15:23
首先,我看不出为什么操作系统应该被“摧毁”。
唯一的问题,你是IMHO面临的是,您将有不同的MAC-嵌入服务器上。
如果它们是相同类型的,具有相同的PCIe时隙分配和网络硬件,则可以很容易地解决这个问题:
将udev中的NIC名称绑定从基于MAC的改为基于PCIe的插槽.
在sles 11上更改它的位置是:/etc/udev/rules.d/70-persistent-net.rules
示例-假设ethtool -i eth0返回0000:04:00.0作为PCIe插槽-位置:
SUBSYSTEM=="net", ACTION=="add", DRIVERS=="?*", KERNELS=="0000:04:00.0", ATTR{dev_id}=="0x0", ATTR{type}=="1", KERNEL=="eth*", NAME="eth0"为此,您不必更改/etc/sysconfig/ not /ifcfg-*中的任何内容。
https://serverfault.com/questions/541373
复制相似问题