1.传统容灾中心的架构 容灾半径是衡量容灾方案所能承受的灾难影响范围的指标。不同灾难的影响范围是不同的,而距离也会影响到容灾技术的选择。 容灾中心的架构按照源备端之间的距离,可分为本地容灾、同城双活、两地三中心。 1.1本地容灾 本地容灾一般指主机集群,当某台主机出现故障,不能正常工作时,其他的主机可以替代该主机,继续正常对外提供服务。 2.容灾级别与能力 容灾系统按保护级别可分为:数据级容灾、应用级容灾、业务级容灾。 云中建立的高可用、高容错架构可以提升RTO和RPO,基于公有云平台或者开源的私有云技术,也可以简便快速灵活地构建容灾节点并将数据迁移或者复制到云端,提升灾难恢复的速度。 随着IT基础架构逐渐云化,容灾也面临着云化转型,不断涌现出更多的云容灾产品和方案。
3台不停止服务的最低限度是2台(X/2+1),而5台的最低限度是3台。 我们应该保证,集群中最低有3台ZooKeeper是启动的。 2zk_pending_syncs 0 启动另外两台机器的Zookeeper 另外两台机器的配置文件 123456 server.1=10.1.24.110:2888:3888server.2 因此我们需要先修改3-5号机器的配置文件为3台,再关闭1-2号机器 关闭 12345 [hadoop@idc02-kafka-ds-02 bin]$ . 2zk_pending_syncs 0 此时的zk_followers为2,说明Leader已经不认1-2号机器了 关闭1-2号机器 关闭idc02-kafka-ds-00 12345 [hadoop 2zk_pending_syncs 0 没有任何影响 实验成功
数据存储容灾建设主要从数据可靠性和业务稳定性两个维度阐述。这两者有哪些区别呢? 详细架构如下: 1.元数据管理:主要负责集群管理功能,例如路由、卷元数据,集群故障探测以及恢复等管理功能 2.driver接入:主要包括client和agent两部分,client作为块设备在用户侧呈现 COS分布式存储系统架构多AZ架构为分层结构主要如下: image.png COS目前具备多AZ属性,如果对于核心数据,成本允许前提下,建议开启跨地域复制功能来进一步加固数据可靠性。 2.业务稳定性 从业务视角来保障稳定性,结合云平台能力,结合自身业务来进一步对业务进行加固。 2.并发上传多个分块。 3.完成整个分块上传,当使用 Upload Part 上传所有分块完成后,必须调用该 API 来完成整个文件的分块上传。
云容灾不仅提供数据备份功能,还结合计算、存储、网络等云服务能力,允许企业在云端快速部署容灾环境,并进行自动化业务恢复。二、传统容灾 vs. 云容灾在云容灾出现之前,企业通常采用传统容灾方案,如自建异地灾备中心或租用灾备机房。 相比之下,云容灾基于云计算技术,充分利用云平台的弹性和智能化能力,提供了一种更灵活、高效的灾备解决方案:对比项传统容灾云容灾基础设施自建或租用物理灾备中心依赖云服务,无需额外硬件成本投入高昂的硬件、机房 高可用性(High Availability)云容灾基于云计算的多区域、多数据中心架构,可提供跨地域的数据冗余备份,确保即使在某一区域发生故障,企业仍然能够切换到其他可用区继续运营。 例如,AWS、Azure 和华为云等云厂商都提供多可用区(AZ)架构,支持跨区域业务切换,以降低单点故障风险。2.
一、根据权限–查询左侧菜单列表 1.写mapper方法,查询菜单和子菜单,继承myBatisPlus(可选) 2.对应mapper语句 3.service根据用户id查询不同的菜单和权限 目前只写了用户可以看到的菜单和子菜单 在实体类加入字段,存放左侧菜单下的子菜单 5.controller查询出来菜单,展示到左侧 5.1工具类,拿user_Idd 工具类 6.结果 二、菜单管理界面 1.controller不返回数据,空页面 2. SysMenyServiceImpl 3.6controller层返回数据 4.运行结果:菜单管理显示数据 三、增删改查根据权限显示 1.查询用户能访问的权限SysMenuMapper,以及对应的sql 2. 测试一下是否查到用户权限 四、增删改查功能实现 1.增加—>选择菜单展示 1.1 SysMenuMapper 1.2对应sql 语句 1.3service层SysMenuService 1.4运行结果 2. 1.SysUserController 记住用户名.密码 展示验证码 aplicationContext中添加anon shiro工具类 常量 八.退出登录 1.修改主页面index.html 2.
本文从云网络概述,云网络容灾复杂度以及典型案例来介绍云网络容灾建设。 1.云网络概述 云网络概述主要分为云服务商基础设施网络架构和云产品两部分,让云上客户更加深入了解云网络,用好云网络。 1.1 云服务商网络架构 本节从业务容灾建设角度来着重说明以下几个问题: 1)云服务商不同可用区云底层网络是完全独立吗? 2.负载均衡公网CLB具备已跨AZ容灾能力 3.NAT网关绑定多个EIP,提升连接数 东西向流量 专线接入、对等链接、云联网、VPN、private link 1.敏感业务建议不要使vpn打通 2.混合云专线接入容灾方案 2.网络容灾复杂度 同城或者异地容灾建设,网络层面因素主要有三个: 1)跨区或者跨地域网络延时,对上层业务影响。 网络延时,通过优化基础设施手段是非常有限的,毕竟受限于实际物理距离和光速。 2)跨区或者跨地域云基础设施容灾能力。 通常云服务厂家数据中心建设均有容灾能力,这里建议还是选择大厂。 3)IDC到云上网络高可用建设。
2. 异地数据冷备方案2.1 API实现方案数据备份:云平台的数据库数据备份均为同地域,因此需要将该备份数据上传到异地COS存储桶。 2)通过url将备份下载到本地 3)调用cos上传api,将本地的备份文件上传到异地cos桶 4)按照备份业务规则,周期性的执行上面1-3步骤,将备份存储到异地COS存储桶。 2.3 数据库备份服务数据库备份服务拥有一套完整的数据备份和数据恢复解决方案,具备实时增量备份以及快速的数据恢复能力,同时具备异地容灾能力。 2)配置数据库备份服务,主要包括备份数据源,备份规则配置。图片3)在北京地域新购同等规格的mysql数据库。4) 使用备份服务恢复在新购数据库恢复数据。注意恢复数据库要求为空库。图片3. 异地数据冷备案例3.1 异地冷备方案以某在线商城为例,涉及数据产品为mysql,reids以及cos,结合云平台的能力,具体方案架构如下:图片方案要点说明:数据备份:基于数据恢复的rto时长,mysql
为了让企业能更好用好云平台的数据安全能力,本文重点云平台数据备份冷备能力,以腾讯云为例,主要从以下两个维度介绍:同城数据冷备能解决企业什么问题,达到怎么样业务容灾效果? 2. ,方案架构如下:图片该方案核心要点说明:数据备份:云侧数据库mysql和redis在控制台设置数据备份参数,数据备份存储在COS,具备地域级别容灾,RPO依赖于数据库备份周期以及时间。 指标详细说明容灾能力具备同地域(不同可用区)数据备份能力,不具备不同地域的能力。 2.业务验证能力,业务恢复相当于业务重新部署,对于业务全面测试验证上线能力要求较高。3.容灾演练能力建设,增加平时运维成本以及自动化工具开发功能。
2. 灾难恢复(Disaster Recovery)阶段定位:灾难发生后的系统重建与容灾关系:现代容灾系统集成恢复功能二、容灾与备份的协同关系1. 功能互补性2. 典型故障应对案例1:数据库误删操作容灾系统同步删除→需从备份恢复案例2:机房级火灾容灾系统接管业务→备份用于数据追溯三、企业灾备体系规划策略1. 风险评估矩阵2. 应用层容灾虚拟化技术:VMware Site Recovery Manager容器化方案:Kubernetes跨集群调度中科热备创新:混合云灾备架构设计五、中科热备解决方案实践1. 政务云建设省级政务云平台:采用中科热备多云灾备方案满足等保2.0三级要求六、灾备体系演进趋势智能化监控:AI预测性维护(中科热备智能运维平台)绿色灾备:液冷技术降低PUE值量子安全:后量子加密技术集成零信任架构
一、为什么需要多机房容灾单机房部署存在诸多风险:硬件故障:服务器、交换机、存储设备故障电力中断:UPS电池耗尽、发电机故障网络故障:光纤被挖断、运营商故障自然灾害:火灾、水灾、地震等不可抗力人为失误:运维操作失误导致服务中断多机房容灾的目标 :RTO(恢复时间目标):接近0RPO(恢复点目标):数据丢失接近0二、多机房架构模式1.主备模式(Active-Standby)展开代码语言:TXTAI代码解释主机房(Active)←同步复制→备机房 (Standby)↓↓读写请求只读/热备特点:架构简单,易于理解和维护资源利用率低(备机房闲置)故障切换需要手动或自动触发适合对可用性要求较高的核心系统适用场景:核心数据库关键业务系统资金交易系统2.双活模式 解决方案:强一致性场景使用同步复制最终一致性场景使用异步复制+补偿机制重要数据采用"写入确认"机制七、总结多机房容灾是保障业务高可用的终极方案:架构选型:根据业务需求选择主备、双活或多活数据同步:根据数据特性选择同步方案流量调度 :DNS+应用层双重保障故障切换:自动化健康检查+快速切换实施建议:优先实现数据层的多机房部署核心系统采用双活架构建立完善的监控和告警体系定期进行故障切换演练思考题:你们系统目前的容灾方案是什么?
现在的容灾系统都包含着灾难恢复的功能,所以本文的讨论除了包括容灾方面的内容,还包括了 灾难恢复的部分内容。高性能、高可用平台架构的演变过程。 容灾系统在企业中给与数据安全系数相当高的保障,但是容灾系统倒是是什么,他们是什么意思?恐怕连正在使用容灾备份的网络管理人员都不能解释。本文用最浅显的语言给大家解释容灾备份到底是什么。 容灾不可少 那么建设了备份系统,是否就不需要容灾备份系统? 如果是同步容灾,那容灾端同时就删除了;如果是异步容灾,那容灾端在数据异步复制的间隔内就会被删除。这时就需要从备份系统 中取出最新备份,来恢复被错误删除的信息。 (2)允许的RTO和RPO指标 从技术上看,衡量容灾系统有两个主要指标:RPO(Recovery Point Object)和RTO(Recovery Time Object),其中RPO代表了当灾难发生时允许丢失的数据量
导语 相对于过去单体或 SOA 架构,建设微服务架构所依赖的组件发生了改变,因此分析与设计高可用容灾架构方案的思路也随之改变,本文对微服务架构落地过程中的几种常见容灾高可用方案展开分析。 另一方面,微服务架构也离不开中心化的组件实现服务治理、应用部署、监控等功能,微服务场景下主备、多活等高可用容灾方案的设计需要通盘考虑。 在分析复杂的容灾架构前,我们首先应当明确问题的定义,拆解问题,分解子问题,从不同维度分开讨论才能获得一个清晰的结论。 2、微服务间调用容灾:TSF 支持 AZ 内就近路由,AZ 内实例不可用时跨 AZ 调用。 部署单元设计:考虑容灾设计,单元与数据库分片绑定,同城单元双活,异地部署灾备单元。
双活、灾备,能帮到我们! 一、单数据中心架构的隐患 单数据中心的常见架构如下图所示,如果在该数据中心在极端情况下,出现网络全阻、设备掉电全阻等情况,业务可能发生全阻。 四、两地三中心的应用双活架构 该架构实际是以上两种方式的结合。双活架构一般是发生是两个数据中心相邻距离不远的场景。如果对于金融级的客户,还会考虑异地的灾备。则采用以下的架构。 五、数据灾备级的容灾方案 对于以上的方案,投入的代价较大,例如需要支付双活数据中心的高速通道费用、相同配置的云主机费用。 2、例如下图,也可以通过纯软件的方式进行灾备,直接将备份的文件放下云端、或线下私有云。 ? 这两种方式本质上都是文件级的灾备方案,因此对于数据库等高可靠性的业务支撑不如日志级的数据同步方案。 2、对于金融级客户,可以选择两地三中心的方案。 3、对于普通企业客户,可以选择数据级的灾备方案。
本文结合云平台公网能力,从网络平台角度来分析容灾建设可行性。 2.公网出口容灾方案 2.1 IDC和云平台出口互为主备 正常情况下,IDC和云平台公网出口流量是烟囱式,互不交叉;当IDC公网出口异常,流量切换到云平台,同样云平台公网出口异常,流量切换到IDC。 整体公网出口容灾方案如下: image.png 2.1.1 云平台切换方案。 正常情况下,业务流量通过NAT访问公网,如上路绿色线条标识。 2.1.2 IDC容灾切换方案 正常情况下,IDC业务流量通过NAT访问公网,如上路绿色线条标识。 IDC公网出口容灾方案 (推荐) 1.方案简单,更多依赖云平台能力 2.方案落地快捷。 3.人力成本低,不需要自建系统。 4.维护成本低,不需要后续维护系统稳定性。
例如,核心业务模块和非核心业务模块高度耦合,从资源成本上来考虑,实际上并不是所有业务均需要做容灾建设,需要加入人力成本对业务进行改造;如果对于延时敏感业务,无法接受跨区延时,需要投入更多人力来进行架构和业务上改造 综上所述,本文从云平台视角出发阐述应用层业务容灾建设,主要分为方案设计考虑纬度、复杂度以及云上客户案例三个方面。 1.应用容灾概述 1.1 应用部署 应用是否满足跨地域/可用区部署? 1)业务完全能接受跨区延时,不同的可用区应用部署规模(1:1),各承载50%的业务流量; 2)业务并不能完全接受跨区延时,为了容灾做业务做了部分妥协,两个可用区业务部署的规模(5:1),主要业务承载在主可用区 容灾切换强依赖于调度系统以及配置系统稳定性。这里稳定性主要包括系统容灾能力和性能;遇到大规模故障,大量信息配置变更请求调度系统和配置系统要能扛住洪峰,是保障这个容灾方案的根基。 2.应用容灾复杂度 计算应用层容灾,主要考虑以下两个方面: 哪些节点执行任务。 这里要区分清楚哪些节点执行核心业务,这里会引入不同的复杂度。
在现代企业的信息系统中,数据库的高可用性与容灾能力是保障业务连续性和数据安全的关键。实现高可用容灾架构对于减少系统故障时间、保障数据一致性以及抵御各种灾难至关重要。 YashanDB作为一款高性能且具备丰富部署形态的数据库解决方案,提供了多种技术和机制来支持稳定、可靠的高可用容灾架构。 本文将基于YashanDB的核心架构和功能,详细阐述如何有效配置系统以实现高可用及容灾目标。 制定完善的备份恢复策略,结合全库备份、增量备份、归档备份及基于时间点的恢复,提高容灾能力。定期监控实例状态和运行日志,利用故障诊断架构及时发现和修复潜在风险。 结论与展望随着业务对数据可靠性、连续性的诉求日益增长,构建稳定的高可用容灾架构已成为数据库系统的核心竞争力。
同城双活和异地双活在数据同步技术上的区别,主要源于距离带来的网络延迟,这直接影响了数据一致性、可用性和架构设计的复杂度。 单元化(Sharding) 是异地双活(及多活)架构中的重要设计。 单元化架构(按用户/业务分片) 成本 专线成本较高,但存储配置可能更简单 异步复制带宽成本相对较低,但架构复杂度和改造成本高 主要优势 高可用、数据零丢失(RPO=0)、故障切换迅速 城市级容灾、更好的用户体验 2、容灾等级要求:同城双活可应对机房级故障。若需防范城市级灾难(如地震、大规模停电),则需异地双活。 3、成本预算:同城双活专线成本较高,但架构相对简单。 异地双活带宽成本可能更低,但架构复杂度和改造投入通常更高。 4、技术能力:异地双活,尤其单元化改造,对技术团队的设计、开发、运维能力要求极高。
容我细细细细分析。 原因就是接口挂了,拿不到数据了。那把数据储存起来就可以解决问题。 思考 存哪里? 第一时间反应浏览器本地存储,想起了四兄弟。 接口容灾我们也是刚弄不久,有许多细节与不足,欢迎沟通交流。 接口容灾本意是预防发生接口服务挂了的场景,我们不会很被动。原来是P0的故障,能被它降低为 P2、P3,甚至在某些场景下都不会有用户反馈。
为什么要做容灾? 你知道吗?自然灾害、设备故障、人为因素等都会造成业务中断。如今数字化时代,IT系统故障更会对公司业务造成难以估量的巨大经济损失。 3 容灾关键词 RPO(Recovery Point Objective) 数据恢复点目标,主要指的是业务系统最大能容忍的数据丢失量。 容灾体系介绍 1 数据中心 集团公司通过两地建立三个数据中心,通过双活、冷备等方式,实现两地三中心容灾架构。 2 体系建设 系统类型 --- 容灾策略 核心业务系统 --- 两地三活 关键平台系统 --- 同城双活 非关键系统 --- 异地冷备 3 技术方案 异地冷备 恢复能力 RTP≤1h RPO≤5min 容灾演习要求 每年进行容灾演练,所有核心业务与平台系统均要参演。 异地灾备恢复、同城双活切换、一键式自动化启停等恢复方式不断创新,要求演习规模逐年扩大和恢复效率逐年提升。 - End - ----
当前,市场上常见的容灾模式可分为同城容灾、异地容灾、双活数据中心、两地三中心几种。 同城容灾 同城容灾是在同城或相近区域内(≤200KM)建立两个数据中心:一个为数据中心,负责日常生产运行;另一个为灾难备份中心,负责在灾难发生后的应用系统运行。 异地容灾 异地容灾主备中心之间的距离较远(>200KM)因此一般采用异步镜像,会有少量的数据丢失。异地灾难备份不仅可以防范火灾、建筑物破坏等可能遇到的风险隐患,还能够防范战争、地震、水灾等风险。 异地灾备中心是指在异地的城市建立一个备份的灾备中心,用于双中心的数据备份,当双中心出现自然灾害等原因而发生故障时,异地灾备中心可以用备份数据进行业务的恢复。 ,所以称为“双活”和“多活”;后者是生产数据中心投入运行,灾备数据中心处在不工作状态,只有当灾难发生时,生产数据中心瘫痪,灾备中心才启动。