有时,服务器会开始显示某种硬件故障,而不是禁用其功能,而是需要亲自到场(如果远程发布,可能需要几天的时间)。
在某些情况下,必须保持服务器保持某些内部状态:它不能关闭,也不能重新启动,但同时,它必须处于尽可能空闲的状态,试图保持它在科技到来之前的状态。
目前,我们手动禁用所有服务,包括数据库、syslog等。有时,它们是几十个,我们必须保留一个选项卡,说明什么是打开还是关闭的。
我知道这,但它没有多大帮助。
是否有一种方法以编程方式完成此操作,并记录已启用的功能,以便在服务器条件改善时正确地重新启动这些服务?
我感兴趣的是任何操作系统的答案,但也可能涉及基于伊利莫斯的金属操作系统(SmartOS / OmniOS),因为这是我们正在使用的设置。
发布于 2021-02-14 16:37:04
在Xen或VMware这样的管理程序之上运行可以让您选择获取快照(包括RAM ),甚至不确定地挂起VM,从而实现您所要求的目标。
您所描述的问题听起来确实是可以通过采取不同的方法来避免的--比如避免在服务器上保留本地状态。由于您没有分享任何关于您操作的环境或为什么需要此设置的信息,这听起来确实过于复杂,并且容易失败。
你给出的细节并没有详细说明“为什么”。
在某些情况下,必须保持服务器保持某些内部状态:它不能关闭,也不能重新启动,但同时,它必须处于尽可能空闲的状态,试图保持它在科技到来之前的状态。
为什么?
如果您需要它来提供替换,这就是配置管理的目的(木偶/ansible/cfengine+类似Foreman之类的东西)
如果需要在替换后继续操作(例如,应用程序状态),请尽可能将其从该框中删除。
https://serverfault.com/questions/1053622
复制相似问题