首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏数据库架构之美

    使用repmgrd实现postgresql failover和auto failover

    前面的文章介绍了postgresql基于repmgr的高可用及切换方案,这篇文章主要聊聊通过repmgrd实现failover及auto failover。 | default | 100 | 3 | host=192.168.1.2 user=repmgr dbname=repmgr connect_timeout=2 failover default | 100 | 4 | host=192.168.1.2 user=repmgr dbname=repmgr connect_timeout=2 auto failover 可以利用repmgrd进程实现自动的failover,首先要在repmgr.conf文件中将location参数设置为一致,不设置的话默认也是一致的。 同时启动repmgrd必须在postgres.conf配置文件中设置shared_preload_libraries='repmgr' 修改主备库repmgr.conf文件 failover=automatic

    2.1K20发布于 2019-12-18
  • 来自专栏简单聊聊Spark

    Hadoop HA及Failover搭建

    Hadoop HA及Failover功能简单介绍: 在Hadoop1.X版本中使用单个NameNode来管理所有的DataNode的元数据,一旦NameNode节点发生故障将导致整个集群不可用,而且必须手动恢复 基于以上致命的缺点,Hadoop2.X提出了HA(High Available)来改进单点故障;另外,通过使用Zookeeper的分布式通知协调功能实现HA的Failover(故障自动转移),而无需人工介入 下面开始介绍HA和Failover的安装配置。 对集群做基本测试,           测试见:http://www.jianshu.com/p/962ac811623f 文章中的测试 ---- 至此,Hadoop的HA及Failover搭建完成,预祝各位朋友搭建成功 如需转载,请注明: z小赵 Hadoop HA及Failover搭建

    84220发布于 2018-09-05
  • 来自专栏有关SQL

    说说Spark的failover容错机制 | 面试系列

    说说Spark的failover容错机制 SPARK计算框架使用3种方式来实现整体的failover机制: 1. driver端的checkpoint 在Driver层实现, 用于在Driver崩溃后

    1.6K20发布于 2019-12-25
  • 来自专栏乐沙弥的世界

    Oracle RAC failover 测试(TAF方式)

    连接时故障转移请参考 Oracle RAC failover 测试(连接时故障转移) Oracle RAC failover 测试(Server TAF方式) 1、TAF描述 #下面关于 (DELAY = 5) ) ) ) 3、FAILOVER_MODE项分析 FAILOVER_MODE项是实现TAF的主要配置内容,下面对其进行描述. alter session语句不会failover。 临时对象不会failover也不能被重新启动。 user ============================================ SID SERIAL# FAILOVER_TYPE FAILOVER_METHOD 来实现基于客户端的TAF c、FAILOVER_MODE中基于连接方式(METHOD)可以分为BASIC与PRECONNECT两种方式,后者开销更大,延迟小,与前者相反 d、FAILOVER_MODE

    2K40发布于 2018-08-14
  • 来自专栏码洞

    一种简单的Failover机制

    这里我们讨论业务端SDK的Failover实现方案。SDK需要管理指向多个Proxy连接,每个请求都需要随机挑选某个Proxy连接进行收发消息。当Proxy都正常时,随机算法已经可以满足负载均衡了。 为降低复杂性,我设计了一个非常简单的方案,可以很好的解决Proxy Failover的问题,步骤如下 给每个Proxy设定一个初值,比如说1024,该值作为随机权重使用 每次请求出现失败一次,就将权值除以一个数 我尝试用代码实现了这个方案,用了非常简洁的十几行代码就搞定了Failover问题。

    1.9K20发布于 2018-08-15
  • 来自专栏分布式系统进阶

    KafkaController分析1-选主和Failover

    的选取, Partition的增加, PartitionReassigned, PreferredReplicaElection, Topic的删除等; ---- 选主 Kafkak中有多处涉及到选主和failover 临时节点被删除handleDataDeleted: 如果当前是leader, 则回调onResigningAsLeader()并同次调用elect开始抢占式选主; KafkaController的选主与Failover 使用ZookeeperLeaderElector作选主和Failover private val controllerElector = new ZookeeperLeaderElector(controllerContext registerSessionExpirationListener() 注册zk连接的状态回调,处理SessionExpiration; controllerElector.startup 开始选主和Failover

    88310发布于 2018-09-05
  • 来自专栏LieBrother

    Dubbo 的集群容错模式:Failover Cluster

    本文简单介绍 Dubbo 中的 Failover Cluster(失败自动切换)。 1 简介 调用实例失败后,继续调用其他实例。 2 如何使用 <dubbo:service cluster="<em>failover</em>" retries="2"/> 或 <dubbo:reference cluster="<em>failover</em>" retries

    1.4K30发布于 2019-04-02
  • 来自专栏乐沙弥的世界

    Oracle RAC failover 测试(Server TAF方式)

    连接时故障转移请参考 Oracle RAC failover 测试(连接时故障转移) Oracle RAC failover 测试(TAF方式)   有关Services的创建请参考 Services =>dbms_service.failover_method_basic, 5 failover_type =>dbms_service.failover_type_select, SQL> select name,failover_method,failover_type,goal,clb_goal from dba_services 2 where name='TAF '; NAME FAILOVER_METHOD FAILOVER_TYPE GOAL CLB_G -------------- 10 SELECT sid, 11 serial#, 12 failover_type, 13 failover_method, 14 failed_over

    97630发布于 2018-08-14
  • 来自专栏数据库学习笔记

    【DG】DataGuard角色转换(Switchover、Failover)及snapshot

    DG的主备角色转换分为:Switchover和Failover。Switchover适用于某些场合,需要将备库转为主库,Failover则是在主库故障无法使用情况下,将备库提升为主库。 switchover是有计划的,正常的切换,不会破坏数据库DG关系 failover是非计划的,破坏性的切换,切换之后要重建DG 一、Switchover操作步骤 大致步骤为主库先转换为备库,在此阶段可能看到原先的主备皆为备库状态 ,考虑执行alter system flush buffer_cache,将内存数据刷到磁盘 写检查点alter system checkpoint 考虑先关闭应用,无用户连接可以减少切换的时间 二、Failover

    2.2K30发布于 2021-04-22
  • 来自专栏从ORACLE起航,领略精彩的IT技术。

    测试12.2.0.1RAC PDB级别的Failover

    关键步骤:手工添加服务名A并启动(已验证默认的服务名测试验证无法实现Failover) [oracle@db90 ~]$ srvctl add service -db orcl -service A - : PDB= (DESCRIPTION = (ADDRESS_LIST = (LOAD_BALANCE = off) (FAILOVER CONNECT_DATA = (SERVER = DEDICATED) (SERVICE_NAME = A) (FAILOVER_MODE

    52210发布于 2019-05-24
  • 来自专栏从ORACLE起航,领略精彩的IT技术。

    Oracle DG测试failover和后续恢复报告

    Oracle DG测试failover和后续恢复报告 一、概述 二、验证过程: 2.1 A库异常关闭 2.2 B库进行failover切换为新主库 2.3 要求C库成为新主库的备库 2.4 要求A库成为新主库的备库 三、结论 一、概述 本文是针对在DG灾备环境进行failover操作以及后续恢复的报告。 将B切换为新的主库,确认failover之后,A库和C库应该如何处理才可以成为新的备库继续使用? 二、验证过程: 2.1 A库异常关闭 A库: SQL> shutdown abort 2.2 B库进行failover切换为新主库 failover 标准步骤如下: #取消DG应用 ALTER DATABASE A库修复后,也可以通过failover之前的现有备份集来恢复到failover之前的状态,而不需要在新主库重新去备份。

    1K10发布于 2019-05-24
  • 来自专栏MongoDB中文社区

    副本集是如何实现自动Failover

    带着这些问题,下面针对副本集的自动Failover机制做一些分析。 日志分析 首先可以确认的是,这次掉电的是一个副本集上的主节点,在掉电的时候,主备关系发生了切换。 下面,我们挖掘一下 ** 副本集的故障转移(Failover)** 机制 副本集是如何实现Failover 如下是一个PSS(一主两备)架构的副本集,主节点除了与两个备节点执行数据复制之外,三个节点之间还会通过心跳感知彼此的存活 图- 主自动降备 第二个是_cancelAndRescheduleElectionTimeout_inlock函数,这里则是实现自动Failover的关键了,它的逻辑中包含了一个选举定时器,代码如下: 但是如果主节点是属于强制掉电,那么整个 Failover 过程将会变长,很可能需要在Election定时器超时后才被副本集感知并恢复,这个时间窗口会在12s以内。

    90030发布于 2019-07-12
  • 来自专栏乐沙弥的世界

    Oracle RAC failover 测试(连接时故障转移)

    测试(TAF方式) Oracle RAC failover 测试(Server TAF方式) 1、Oracle failover的几种方式 Oracle failover也叫故障转移,从Oracle Client-Side Connect time Failover 客户端连接failover模式,此方式较为简单,只要安装了rac集群,缺省情况下即被启用。 b. Failover来自Oracle 的官方描述 ID 453293.1 The connect-time failover enables clients to connect to another 基于客户端的failover比较好理解。 且FAILOVER_TYPE,FAILOVER_METHOD,FAILED_OVER几个至没有发生任何变化 #因为这几个参数主要是针对TAF。

    1.5K20发布于 2018-08-14
  • 来自专栏软件开发-青出于蓝

    Dubbo集群容错模式之Failover实现 原

    图1 Dubbo的FailoverClusterInvoker类继承图 1.Failover的含义     Failover可以理解为当出现失败,重试其它服务器。 2.Failover的实现     核心代码在FailoverClusterInvoker的doInvoke(Invocation,List<Invoker<T>>,LoadBalance)中,源码如下

    96220发布于 2019-04-15
  • 来自专栏开源部署

    Oracle 11g DG Broker 自动failover

    Performing failover NOW, please wait... Failover succeeded, new primary is "db2" 20:16:01.77  Thursday, July 04, 2019 4.2 failover的过程和手工failover 一样,不管是自动failver,还是手动执行FAILOVER TO ,都是执行了用命令行failover的命令如下两条命令: alter database  recover managed standby ; DGMGRL> help failover Changes a standby database to be the primary database Syntax: FAILOVER TO <standby 后, 1.查看从库failover成为主的时候的scn号。

    71010编辑于 2022-08-18
  • 来自专栏PT运维技术

    MHA故障failover执行不成功的背后的大坑

    mha_abc.cnf root 28268 0.0 0.0 9556 1160 pts/5 S 02:37 0:00 sh -c /data/soft/mha/scripts/abc/master_ip_failover manager.log 2>&1 root 28269 0.0 0.2 27444 3696 pts/5 S 02:37 0:00 perl /data/soft/mha/scripts/abc/master_ip_failover mha_abc.cnf root 28268 0.0 0.0 9556 1160 pts/5 T 02:37 0:00 sh -c /data/soft/mha/scripts/abc/master_ip_failover manager.log 2>&1 root 28269 0.0 0.2 27444 3696 pts/5 T 02:37 0:00 perl /data/soft/mha/scripts/abc/master_ip_failover tt -s 4096 masterha_manager --conf=/data/soft/mha/conf/abc/mha_abc.cnf >/tmp/trace.log 2>&1 & 关闭主库,触发failover

    72620编辑于 2022-06-14
  • 来自专栏DB说

    ORACLE 12C DG BROKER配置切换以及FAST FAILOVER介绍

    【背景】 通常情况下习惯使用sqlplus命令对数据库primary以及dataguard进行switchover、failover.虽然oracle很早在10g时候就推出dg broker MaxPerformance Members: PRIMARY- Primary database STANDBY- Physical standby database Fast-Start Failover : Yes (Primary Running)---表示可以failover并提示主库 Flashback Database Status: PRIMARY: Off STANDBY 【介绍fast failover】 备注:在12c之前,observer只能启动一个,通过守护进程启动且必须要启动在备库上(如果启动在主库,出现主库网络不通或者其他原因,导致fast failover 功能不可用),12.2 fast failover高可用优化,启动3个observer,一个master,2个backup,且变成系统进程(不在通过&方式启动).关于具体配置测试,后续会详细介绍。

    1.5K20发布于 2020-08-05
  • 来自专栏释然IT杂谈

    【干货】思科ASA防火墙上配置透明模式的Failover ActiveAcitve

    【感谢波总投搞】 Failover Active/Acitive是ASA学习中不可绕过的环节,网络上现有的大量案例都是在路由模式下完成的,鲜有透明模式下的Failover Active/Acitve,所以在 ⑵配置FO和Stateful链路,用于Failover组互相监控 fw1(config)#failover lan unit primary //注意此外为primaryfw1(config)#failover )#failover lan interface FO Ethernet0/4fw1(config)#failover link Stateful Ethernet0/5fw1(config)#failover ⒊开启failover功能 ⑴物理防火墙fw1上开启failover fw1(config)#failover ⑵物理防火墙fw2上开启failover fw2(config)#failover 4.修改提示符 图-2 fw1上显示的failover组状态 在初次启动failover后,常常发现从物理防火墙fw1上看到的failover组状态,出现两个active,而正常时,常如图-2所示的一个active和一个

    1.6K30发布于 2021-11-16
  • 来自专栏释然IT杂谈

    【干货】思科ASA防火墙上配置透明模式的Failover ActiveAcitve

    failover lan interface FO Ethernet0/4 fw1(config)#failover link Stateful Ethernet0/5 fw1(config)#failover )#failover polltime unit msec 200 holdtime msec 800 ⑷配置failoverFailover组中的primary是一个物理概念,不会因为网络的运行而发生变化 )#failover lan interface FO Ethernet0/4 fw1(config)#failover link Stateful Ethernet0/5 fw1(config)#failover ⒊开启failover功能 ⑴物理防火墙fw1上开启failover fw1(config)#failover ⑵物理防火墙fw2上开启failover fw2(config)#failover 4.修改提示符 图-2 fw1上显示的failover组状态 在初次启动failover后,常常发现从物理防火墙fw1上看到的failover组状态,出现两个active,而正常时,常如图-2所示的一个active和一个

    1.3K10编辑于 2022-10-27
  • 来自专栏扎心了老铁

    redis的sentinel主从切换(failover)与Jedis线程池自动重连

    redis-3.2.9/sentinel # sentinel监控哪个主节点 sentinel monitor mymaster 10.93.21.21 6379 1 # 主节点挂掉多长时间,判定为挂掉,开始failover sentinel down-after-milliseconds mymaster 10000 # failover交由几个sentinel执行 sentinel parallel-syncs mymaster 1 # failover多长时间没完成,超时失败 sentinel failover-timeout mymaster 180000 启动sentinel集群 bin/redis-sentinel conf

    2.5K60发布于 2018-03-05
领券