搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏苏三说技术
系统高可用的 10 条军规
前言系统高可用是非常经典的问题，无论在面试，还是实际工作中，都经常会遇到。这篇文章跟大家一起聊聊，保证系统高可用的10条军规，希望对你会有所帮助。 # 10%流量走新版本效果：新版本异常时，仅影响10%的用户，快速回滚无压力。总结系统高可用建设就像打造一艘远洋巨轮。冗余部署是双发动机，熔断降级是救生艇，监控体系是雷达系统。但真正的关键在于：故障预防比故障处理更重要（如混沌工程）自动化是应对复杂性的唯一出路（如K8s弹性扩缩）数据驱动的优化才是王道（全链路压测+立体监控）没有100%可用的系统，但通过这10个实战技巧，我们可以让系统的可用性从99%提升到99.99%。
34410编辑于 2025-03-20
来自专栏技术杂记
Mycat HA(高可用) 与 LB(负载均衡)10
mysql> select * from abc; +----+------+ | id | name | +----+------+ | 2 | abc | | 6 | abc | | 10
46140编辑于 2021-12-02
来自专栏MySQL
10款常见MySQL高可用方案选型解读
一、概述我们在考虑MySQL数据库的高可用架构时，主要考虑如下几方面：如果数据库发生了宕机或者意外中断等故障，能尽快恢复数据库的可用性，尽可能的减少停机时间，保证业务不会因为数据库的故障而中断。关于对高可用的分级我们暂不做详细的讨论，这里只讨论常用高可用方案的优缺点以及选型。二、高可用方案 1 、主从或主主半同步复制使用双节点数据库，搭建单向或者双向的半同步复制。并且多节点同时宕机的几率也要小于单节点宕机的几率，所以多节点架构在一定程度上可以认为高可用性是好于双节点架构。但由于数据库数量较多，所以需要数据库管理软件来保证数据库的可维护性。，是多主数据同步的MySQL集群解决方案，使用简单，没有单点故障，可用性高。期望越来越多优秀的解决方案被提出，MySQL高可用问题也可以被更好的解决。
6.6K100发布于 2018-05-11
来自专栏全栈程序员必看
rabbitmq高可用集群搭建_mongodb高可用架构
RabbitMQ 高可用集群搭建 1 集群简介 1.1 集群架构当单台 RabbitMQ 服务器的处理消息的能力达到瓶颈时，此时可以通过 RabbitMQ 集群来进行扩展，从而达到提升吞吐量的目的一个高可用，负载均衡的 RabbitMQ 集群架构应类似下图：这里对上面的集群架构做一下解释说明：首先一个基本的 RabbitMQ 集群不是高可用的，虽然集群共享队列，但在默认情况下，消息只会被路由到某一个节点的符合条件的队列上 HAProxy 同时支持四层和七层负载均衡，并基于单一进程的事件驱动模型，因此它可以支持非常高的井发连接数。此时对外服务的 VIP 依然可用，代表已经成功地进行了故障转移。 juejin.im/post/6844904071183220749 RabbitMQ 官方文档 —— 集群指南：www.rabbitmq.com/clustering.… RabbitMQ 官方文档 —— 高可用镜像队列
3.1K10编辑于 2022-09-30
来自专栏SY小站的专栏
ingress高可用
path: /healthz port: 10254 scheme: HTTP initialDelaySeconds: 10 periodSeconds: 10 successThreshold: 1 timeoutSeconds: 10 kube-proxy转发到Ingress Controller的pod上,多走一趟路 4、不创建svc,效率最高,也能四层负载的时候不修改pod的template,唯一要注意的是`hostNetwork: true 高可用选择第四种 periodSeconds: 10 successThreshold: 1 timeoutSeconds: 10 https://zhangguanzhang.github.io/2018/10/06/IngressController/
2.7K30发布于 2020-06-15
来自专栏后台技术底层理解
redis高并发高可用
redis 实现高并发主要依靠主从架构，一主多从. 对于性能来说，单主用来写入数据，单机几万QPS，多从用来查询数据，多个从实例可以提供每秒 10w 的 QPS。 redis 高可用，如果是做主从架构部署，那么加上哨兵就可以了，就可以实现，任何一个实例宕机，可以进行主备切换。所以就有了几个问题？什么是主从架构，主从如何备份？哨兵用于实现 redis 集群的高可用，本身也是分布式的，作为一个哨兵集群去运行，互相协同工作。哨兵 + redis 主从的部署架构，是不保证数据零丢失的，只能保证 redis 集群的高可用性。 ==怎么保证redis是高并发以及高可用的==？ sdown 和 odown 转换机制 sdown 是主观宕机，就一个哨兵如果自己觉得一个 master 宕机了，那么就是主观宕机。
3.4K10发布于 2020-08-04
来自专栏写代码和思考
高可用 - 简述
背景本文记录一些高可用的内容，和数据库在高可用方面的演进过程。 1. 概念可用性: 即软件系统在一段时间内提供有用资源的能力。高可用性描述了一个周期内的功能连续可用的绝对程度，可表示为正常运行时间和停机时间之间的关系，如下公式： A = 100 – (100*D/U) 备注：A 表示可用性；D 表示非计划停机时间；U 表示正常运行时间如何设计来做到高可用保证系统高可用，架构设计的核心准则是：冗余和故障转移。单点系统的问题是，挂了就完全不可用了，服务会受影响。如果有冗余备份，其他后备的系统能够顶上，保证服务继续可用。所以，又往往是通过“自动故障转移”来使得快速切换到备份系统来实现高可用。常见的互联网分布式架构是：前端 ---> 反向代理 --> WEB应用 --> 服务 --> 数据库（及缓存）其中，高可用可涉及到上面每个节点的高可用保障，我们看下数据的高可用架构的演变过程。
2.2K10发布于 2020-05-08
来自专栏问天丶天问
SkyWalking 高可用
生产环境中，后端应用需要支持高吞吐量并且支持高可用来保证服务的稳定，因此需要高可用集群管理。高可用需要：至少一个 Nacos（可以是nacos集群）至少一个 ElasticSearch / mysql（可以是es/msql集群）至少2个skywalking oap服务；至少1个UI（UI
61710编辑于 2024-10-03
来自专栏编程一生
实践高可用
　本篇文章是之前一篇《大话高可用》的高可用心法的案例篇。　　说实践之前先说概念。　　具体实践如下：架构高可用　　交易这边进行在进行重构。将原有的核心交易从职责上划分为交易收单、交易保障和数据中心三个大块。　　从高可用上，交易收单要保证实时交易现场的可用。所以它才是对高可用需要考虑最多的，对MTBF和MTTR都要考虑和权衡。但是在对高可用要求上交易收单和交易保障是基本职责，指标就是稳定、稳定和稳定。数据中心关乎的用户体验，是可以持续优化的，但是对高可用是有一定容忍度的：比如页面会加载慢，或者第一次加载不了刷新就成功了。异常流量下线程不得被block 异常流量下磁盘IO不得超过7 维度三：不对业务方单独限流，各个业务方如果有流量异常及时报警　　交易限流原则：每月压测后重新限流阈值评估单机QPS 10
1.2K30发布于 2018-07-02
来自专栏编程一生
大话高可用
　　今天老大跟我讨论说，没有看到过一篇够全面体系的高可用的文章。谈到高可用，基本都是以偏概全的文章。今晚抽空想了一下这个问题。　　高可用我另一个更资深老大其实总结的很全面了：别人死我们不死，自己不作死，不被队友搞死。　　然后就是怎么别人死我们不死：最好就是别人的东西和我们没关系，就是去依赖。如果实在有依赖呢，那就尽量弱依赖。
1.1K20发布于 2018-07-02
来自专栏用户1337634的专栏
高可用 --- Redis
因为Redis拥有诸多优秀的特性，使用范围越来越广，系统对其可用性的依赖也越来越重，当前绝大部分系统使用的Redis都实现了高可用。这里主要介绍Redis官方推荐的两种高可用方案Sentinel和Redis Cluster。（如有不明白可以参考《Redis设计与实现》）高可用 Redis实现高可用主要有两种方式，一种是Sentinel（3.0之前），一种是3.0正式支持的Redis Cluster（推荐）。举个例子，在一个由10个Sentinel组成的Sentinel系统里面，只要有大于等于10/2+1=6个Sentinel将某个Sentinel设置为局部领头Sentinel，那么被设置的那个Sentinel 如果master没有设置持久化，存在风险，如果不小心重启，则会丢失所有数据，而且从机也会因为同步，丢失所有数据（所以一定要高可用）。
1.2K40发布于 2019-03-27
来自专栏院长运维开发
ingress高可用
periodSeconds: 10 successThreshold: 1 timeoutSeconds: 10 app.kubernetes.io/name: ingress-nginx app.kubernetes.io/part-of: ingress-nginx --- Ingress Contronler 高可用也就是使用了主机的dns,会导致svc的请求直接走宿主机的上到公网的dns服务器而非集群里的dns server,需要设置pod的dnsPolicy: ClusterFirstWithHostNet即可解决高可用选择第四种 periodSeconds: 10 successThreshold: 1 timeoutSeconds: 10 successThreshold: 1 timeoutSeconds: 10
2.7K20发布于 2020-06-13
来自专栏PHPer 进击
MySQL - 高可用性：少宕机即高可用？
我们之前了解了复制、扩展性，接下来就让我们来了解可用性。归根到底，高可用性就意味着 "更少的宕机时间"。老规矩，讨论一个名词，首先要给它下个定义，那么什么是可用性？ 1 什么是可用性我们常见的可用性通常以百分比表示，这本身就有其隐藏的意味：高可用性不是绝对的。换句话说，100% 的可用性是不可能达到的。没错，这里可以这么肯定的说。说起来可能有点绕，简单来说：对于有 10W 用户的应用，假设实现 5 个 9 需要 100W，每年应用即使宕机 9 小时，总损失也才 50W，你说这个应用有必要去实现 5 个 9 的可用性吗？糟糕的表结构设计和索引设计复制 20% 主备数据不一致数据丢失或损坏 10% 误操作删除数据，缺少备份运行环境通常可以看作是支持数据库服务器运行的系统资源集合，包括操作系统、硬盘以及网络等。 3 如何实现高可用性通过上面的分析，也许你已经发现了，我们可用性取决于两个时间：应用的平均失效时间应用的平均恢复时间因此，提高可用性也可以从这两个方面入手。
2.1K20发布于 2019-05-13
来自专栏深入理解Android
高并发与高可用实战
高可用高可用：相对于高并发来说，高可用并不是一个比较有规律的参数，7*24 是每个网站的梦想，但是你并不知道，在某一刻，他就没理由的宕机了。高并发设计原则系统设计不仅需要考虑实现业务功能，还要保证系统高并发、高可用、高可靠等。高可用设计原则通过负载均衡和反向代理实现分流。通过限流保护服务免受雪崩之灾。通过降级实现部分可用、有损服务。通过隔离实现故障隔离。降级对于高可用服务，很重要的一个设计就是降级开关，在设计降级开关时，主要依据如下思路： 1.开关集中化管理：通过推送机制把开关推送到各个应用。这样就可以把一些同步调用改成异步调用，优先处理高优先级数据或特殊特征的数据，合理分配进入系统的流量，以保障系统可用。
2.1K20编辑于 2022-06-22
来自专栏后台技术底层理解
redis 的高并发高可用
redis 实现高并发主要依靠主从架构，一主多从. 对于性能来说，单主用来写入数据，单机几万QPS，多从用来查询数据，多个从实例可以提供每秒 10w 的 QPS。 redis 高可用，如果是做主从架构部署，那么加上哨兵就可以了，就可以实现，任何一个实例宕机，可以进行主备切换。所以就有了几个问题？什么是主从架构，主从如何备份？哨兵用于实现 redis 集群的高可用，本身也是分布式的，作为一个哨兵集群去运行，互相协同工作。哨兵 + redis 主从的部署架构，是不保证数据零丢失的，只能保证 redis 集群的高可用性。怎么保证redis是高并发以及高可用的？ sdown 和 odown 转换机制 sdown 是主观宕机，就一个哨兵如果自己觉得一个 master 宕机了，那么就是主观宕机。
1.9K00发布于 2020-08-04
来自专栏用户8645177的专栏
Redis-高可用
单机版特点：简单问题： 1、内存容量有限 2、处理能力有限 3、无法高可用。特点： 1、master/slave 角色 2、master/slave 数据相同 3、降低 master 读压力在转交从库问题：无法保证高可用没有解决 master 写的压力哨兵 Redis 特点： 1、保证高可用 2、监控各个节点 3、自动故障迁移缺点：主从模式，切换需要时间丢数据没有解决 master 写的压力集群（proxy 型）： Twemproxy 是一个 Twitter hsieh、murmur、Jenkins 2、支持失败节点自动删除 3、后端 Sharding 分片逻辑对业务透明，业务方的读写方式和操作单个 Redis 一致缺点：增加了新的 proxy，需要维护其高可用 4、高可用性，部分节点不可用时，集群仍可用。
82550发布于 2021-05-22
来自专栏后台技术底层理解
消息队列高可用
常见的消息队列有ActiveMQ,RabbitMQ,RocketMQ,kafka,前两个属于集群模式部署来提供高可用，后两个可以部署分布式模式提供HA。集群模式MQ ? 2.可用性难以保障，如果queue所在的主机挂掉，那么queue数据就会丢失。镜像集群MQ ? kafka的高可用，对写入的机器进行备份，在一个相同副本的主机中分为leader和follower,保证集群的高可用。如何保证消费系统的幂等性？
56320发布于 2020-08-04
HDFS HA 高可用
HA 概述 1）所谓 HA（High Available），即高可用（7*24 小时不中断服务）。 2）实现高可用最关键的策略是消除单点故障。自动故障转移为 HDFS 部署增加了两个新组件：ZooKeeper 和 ZKFailoverController（ZKFC）进程，ZooKeeper 是维护少量协调数据，通知客户端这些数据的改变和监视客户端故障的高可用服务
27400编辑于 2025-12-23
canal高可用原理
Canal 的高可用（HA）实现主要依赖于 ‌ZooKeeper 的分布式协调能力‌，通过其临时节点（EPHEMERAL）和 Watcher 机制实现 Server 和 Client 两个层面的故障自动转移其核心原理如下：一、‌Canal Server 高可用原理‌ 1.Instance 启动竞争机制‌ 当多个 Canal Server 尝试启动同一个 Instance（数据同步实例）时二、‌Canal Client高可用原理‌ ‌1.动态路由机制‌ Client 启动时，‌首先查询 ZooKeeper‌ 获取当前运行目标 Instance 的 Server 地址。四、高可用架构示例 ZK[ZooKeeper] -->|临时节点抢占| ServerA[Canal Server A] ZK -->|临时节点抢占| ServerB[Canal Server B Client -->|查询ZK| ServerA Client -->|失败重连| ServerB[新活跃节点] ‌ 通过上述机制，Canal 实现了 Server 和 Client 双层面的高可用
22510编辑于 2025-12-23
来自专栏A周立SpringCloud
从MySQL高可用架构看高可用架构设计
百度的搜索首页，是业内公认高可用保障非常出色的系统，甚至人们会通过www.baidu.com 能不能访问来判断“网络的连通性”，百度高可用的服务让人留下啦“网络通畅，百度就能访问”，“百度打不开，应该是网络连不上 MySQL高可用说到MySQL的高可用，不得不提到复制，复制是MySQL高可用的基础。复制解决了什么问题呢？ 1.2 高可用复制架构 ? 1.3.mysql 高可用架构 1.3.1 MySQL Cluster架构限制存储引擎为NDB存储引擎： ? 为了高可用的保证，有了多主或者主从切换。数据库的高可用架构一般在系统的底层，这方面的技术要求比较高，整个高可用系统大致如下： ? 3.总结我们都知道，单点是系统高可用的大敌，单点往往是系统高可用最大的风险和敌人，应该尽量在系统设计的过程中避免单点。
1.3K20发布于 2019-08-23

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

系统高可用的 10 条军规

Mycat HA(高可用) 与 LB(负载均衡)10

10款常见MySQL高可用方案选型解读

rabbitmq高可用集群搭建_mongodb高可用架构

ingress高可用

redis高并发高可用

高可用 - 简述

SkyWalking 高可用

实践高可用

大话高可用

高可用 --- Redis

ingress高可用

MySQL - 高可用性：少宕机即高可用？

高并发与高可用实战

redis 的高并发高可用

Redis-高可用

消息队列高可用

HDFS HA 高可用

canal高可用原理

从MySQL高可用架构看高可用架构设计

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐