首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何使用有限的测试资源进行恢复测试?

如何使用有限的测试资源进行恢复测试?
EN

Server Fault用户
提问于 2016-12-10 06:40:44
回答 3查看 1.5K关注 0票数 4

一个资源有限的小型组织如何对其数据备份系统进行恢复测试?

“测试你的后备力量!”在不影响主线系统的情况下,面对全面恢复测试所涉及的实际情况,似乎是不现实的。

假设该组织没有价值数万美元的备用服务器容量,只是用于临时拆分一个完整的测试环境,以验证夜间备份是可恢复的。

是否有一种方法可以证明第二次购买所有主线硬件是合理的,仅仅是为了进行年度恢复测试,但如果不是这样的话,它就在存储中,断电而不使用?

在关于媒体恢复测试的其他服务器故障讨论中,有人建议使用单独的磁带驱动器来确认媒体在另一个设备中是可用的。

对于一个只有几台服务器和一个生产磁带驱动器的小型站点来说,似乎很难用数千美元购买额外的LTO-7磁带驱动器,并为备份软件提供额外的许可,只需将其用于每年一次的媒体恢复/测试环境验证过程,然后将其固定在货架上,直到明年的测试过程才开始使用。

EN

回答 3

Server Fault用户

发布于 2016-12-10 10:52:31

你测试你的备份主要是为了测试你的恢复过程,这样当你处于危机状态时,你就会知道该做什么,当每个人都恐慌的时候,你会很有能力,自信,冷静,并且准确地知道该做什么和恢复大约需要多长时间等等,因为到那时恢复备份是一个常规事件。

您可能想要做的第二件事是测试数据完整性,一旦您恢复了关键数据,可以恢复生产吗?没有任何东西被破坏或不完整吗?

你可以而且很可能应该一次测试这两件事。只有在基本操作完成之后,才能尝试恢复整个数据中心。

例如,如果对文件系统和网络共享进行备份,一个合适的测试将是在另一个位置恢复特定目录,并将文件大小、哈希和权限与原始目录进行比较。

下次需要克隆数据库进行测试时,请从备份中恢复生产数据库。

如果需要的话,在VM上做一个“裸金属”OS恢复。

但是备份和恢复只是更大的灾难恢复策略和业务连续性计划的一个方面。

当你目前的位置因自然灾害(火灾、洪水、飓风等)而失去时,你的公司会怎么做?它是否可以继续在其他现有地点运作,还是你的公司是唯一的所在地,企业是破产了,还是保险资金被用来租用应急办公室/集装箱?

这是几年前在一家公司采用的BCP策略:与惠普( HP )或当时的IBM签订合同,每年在一个容器中提供一次数据中心,用于完整的数据中心灾难恢复测试,并在发生紧急灾难时将数据中心置于备用状态。

那家公司有一个办公设施,只有现场以外的磁带(或者可能是一个磁带机器人)和其他所有的内部设备。他们的想法是,租用临时装修的办公空间,获得互联网连接和重新安排电话号码,获得台式机和打印机等将主要是商品,易于安排。但它稍微少了一点。双数据中心的成本效益计算是不利的.

因此,最初每6个月进行一次,但之后每年进行一次完整的BCP测试,但在临时租用的硬件上进行:部署VMWare、恢复备份服务器、用AD域控制器、邮件服务器、数据库和应用服务器以及文件共享恢复VM。

一个更现代的BCP策略可以是基于云的,并且使用在线的场外备份副本和您在云中测试您的DR还原,如果您只需要它们几天,即使是相当多的VM也不会破坏银行。

票数 4
EN

Server Fault用户

发布于 2016-12-10 13:16:11

套用一句古老的谚语

灾难是肯定的,恢复-不完全是。

简而言之,备份和恢复测试是绝对需要的。为了有一个良好的备份和恢复计划,我想强调以下几点:

  • 在与管理层沟通时要清楚,定期恢复是一种真正的需要。这往往是最困难的部分,因为管理层认为任何没有直接、直接利益的东西都是多余的。可悲的现实是,他们的数据面临风险,他们需要明白,定期恢复,尽管有相关的成本,是一项值得的投资。
  • 就您而言,要非常努力地避免用于存储备份的专有二进制块:它们很难被检查,并且提供很少到没有部分恢复的可能性。强烈喜欢开放的、可检查的文件格式(如tar),或者更好的是使用rsync (或类似工具)对数据进行文件系统级备份。使用这些工具,您可以非常容易地检查您的备份,并且一目了然地知道是否所有(或大多数)都已存在/可访问。
  • 要快速恢复,请尝试获得关键虚拟机的二进制映像(通过快照)。这有一个额外的优点,就是可以立即检查,只需在任何配备兼容虚拟化软件的工作站上导入/启动它(现在所有主要的虚拟化平台都有免费的试用版本,非常适合这种“廉价”恢复)。
  • 对于数据库,使用适当的转储工具并将其还原到虚拟机中,然后要求单个用户使用还原的数据库,并快速检查应用程序是否工作,以及最近的数据(即昨天)是否存在。
  • 当备份和恢复过程生效时,将其记录下来:当某些事情出错时,您将有一个非常清晰的操作计划,这将减少压力,增加成功的机会。

为了快速、符合成本效益地恢复,关键是要充分利用临时虚拟机,在廉价硬件上运行(请参阅:已退役的服务器或工作站)。如果磁盘空间是一个问题,做广泛使用薄提供。如果可用的RAM是问题所在,每次只恢复一个小的VM子集(甚至一个)。

票数 2
EN

Server Fault用户

发布于 2016-12-10 15:35:43

For a small site with only a few servers and a single production tape drive, it seems hard to justify buying an additional LTO-7 tape drive for thousands of dollars and additional licensing for the backup software to go with it, just to use it for a once-per-year media restore / test environment verification process and then stick it on a shelf and don't use it until next year's test process.

大多数公司实际上并没有这样做。原因是他们认为,在不太可能的情况下,如果他们需要替换备份硬件,在发生完全和灾难性的损失时,他们可以购买所需的硬件,并在几个小时内(以一个价格)购买。因此,您的计划不一定包括购买备用硬件、软件、许可证等。

票数 1
EN
页面原文内容由Server Fault提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://serverfault.com/questions/819935

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档