首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏全栈程序员必看

    系统可用性几个9

    经常看到各种技术文章或者分布式系统介绍说系统的可用性达到了多少个9,那么所谓”几个9“到底是怎么计算的?又意味着什么?我们简单计算分析下看看。 所谓”1个9“是指90%,”2个9“是指99%,”3个9“是指99.9%,依次类推。 如果按照年为单位计算系统的故障时间,公式如下: 故障时间秒数=(1-可用性) * 365 * 24 * 3600 计算10个9以内的情况得到如下结果: 99.jpeg 可见,如果只有 1个9可用性,体验是极其糟糕的,1年下来有1个多月不能使用。 一些大型网站号称能过做到4个9,那么1年有52分钟故障时间,其实已经是不错的情况了。如果要宣传自己拥有10个9可用性,那么意味着100年以内只会故障3秒钟;所以各大厂商的无脑吹嘘也要适可而止。

    89110编辑于 2022-09-14
  • 来自专栏从ORACLE起航,领略精彩的IT技术。

    Vertica 可用性测试

    Vertica也是MPP架构的数据库,相比大家熟悉的MPP架构,比如Greenplum和hadoop这些产品,Vertica最大的不同就是没有主节点这个概念。 也就是说Vertica集群中(K-safe=1情况),任何一个节点宕机都不会影响到其他节点对外提供服务。 而在其他有主节点的架构中,一旦主节点挂掉,整个集群就会挂掉,所以还需要考虑进一步冗余主节点。

    93820编辑于 2022-05-06
  • 来自专栏云计算教程系列

    什么是可用性

    可用性是一种大规模的基础设施设计,可以满足后面的考虑因素。 在本指南中,我们将讨论什么是可用性意味着什么,以及它如何提高您的基础架构的可靠性。 什么是可用性? 对于您的基础架构实现可用性是减少这类事件的影响的有用策略。高度可用的系统可以自动从服务器或组件故障中恢复。 什么使系统高度可用? 可用性的目标之一是消除基础架构中的单点故障。 这就是使用浮动IP的可用性基础架构的样子: 可用性需要哪些系统组件? 在实践中实现可用性时,必须仔细考虑几个组件。 可用性系统必须在发生故障时考虑数据安全性。 网络:计划外网络中断是可用性系统的另一个可能的故障点。为可能的故障制定冗余网络策略非常重要。 可以使用哪些软件来配置可用性可用性系统的每一层在软件和配置方面都有不同的需求。但是,在应用程序级别,负载平衡器是创建任何可用性设置的重要软件。

    7.3K00发布于 2018-10-25
  • 来自专栏码农沉思录

    可用性高达5个9!支付系统可用架构设计实战

    为此,对应用可用性程度的衡量标准一般有3个9到5个9。 为了实现可用,「付钱拉」从避免单点故障、保证应用自身的可用、解决交易量增长等方面做了许多探索和实践。 本文重点讨论如何提高应用自身的可用性,关于如何避免单点故障和解决交易量增长问题会在其他系列讨论。 为了提高应用的可用性,首先要做的就是尽可能避免应用出现故障,但要完全做到不出故障是不可能的。 (2)限制资源的使用 对于资源使用的限制设计是可用系统最重要的一点,也是容易被忽略的一点,资源相对有限,用的过多了,自然会导致应用宕机。 Q9:rsyslog归集日志怎么存储的?

    1K10发布于 2019-06-17
  • 来自专栏宜信技术实践

    可用性高达五个9!支付系统可用架构设计实战

    为此,对应用可用性程度的衡量标准一般有3个9到5个9。 为了实现可用,宜信支付系统从避免单点故障、保证应用自身的可用、解决交易量增长等方面做了许多探索和实践。 本文重点讨论如何提高应用自身的可用性,关于如何避免单点故障和解决交易量增长问题会在其他系列讨论。 为了提高应用的可用性,首先要做的就是尽可能避免应用出现故障,但要完全做到不出故障是不可能的。 下图是部分业务消息队列拆分图: [1536657329589032521.png] (2)限制资源的使用 对于资源使用的限制设计是可用系统最重要的一点,也是容易被忽略的一点,资源相对有限,用的过多了, Q9:rsyslog归集日志怎么存储的?

    1.8K31发布于 2019-07-02
  • 来自专栏全栈程序员必看

    架构要素-可用性

    可用性—万无一失 实现可用架构的主要手段是数据和服务的冗余备份及失效转移。 可用的应用: 应用层主要处理站点应用的业务逻辑,因此也称业务逻辑层,应用的一个显著特点是应用的无状态。 可用的服务: l 分级管理 l 超时设置 l 异步调用 l 服务降级:两种手段,拒绝服务(拒绝非关键业务服务,或降低拒绝部分非关键服务,以保证核心服务)和关闭服务。 可用的数据: l CAP, 大型站点中。一般会选择强化分布式存储系统的可用性(A)和伸缩性(P)。而在某种程度上放弃一致性(C). 对不一致性数据进行某种意义的补偿和纠错。

    60120编辑于 2022-07-10
  • 来自专栏huofo's blog

    5、pgpool-II可用性(一)数据库的可用性

    官网示例 一、实现原理 使用 pgpool-II 软件;我们常用来实现流复制的可用性;备库只读的,不可写;就是当主库出现问题时;需要把备库自动激活为主库;来接管服务。 这在其他可用软件也有这功能,而 pgpool-II 在配置文件 pgpool.conf 中提供配置项 failover_command 。让用户配置一个脚本,当发生故障切换时,执行该脚本。 演练目的: 搭建 pgpool 集群 测试数据库的可用性 修复 primary 节点重新加入集群 2.1、环境规划 1、PostgreSQL库的IP/Port规划 主机名 角色 ip 端口 数据目录                  |                   |                         | 2020-12-01 14:38:09 (2 rows) 2.4、测试可用性

    2.6K20编辑于 2022-03-18
  • 来自专栏一个会写诗的程序员的博客

    SLA服务可用性4个9是什么意思?如何保证服务的可用性 HA(High Availability)?

    如何保证服务的可用性 HA(High Availability)? 首先,SLA的概念,对互联网公司来说就是网站服务可用性的一个保证。9越多代表全年服务可用时间越长服务更可靠,停机时间越短,反之亦然。 这么多9是怎么计算的呢? 一个简单的例子就是某服务可用性从99.9%提高到99.99%所需要的资源和带来的收益之比,是决定该服务是否应该提供4个9的重要依据。 在这个时候,其实还可以定义服务降级,例如微信最常用的功能是发送消息和朋友圈,这两个服务的可用性可以定义为四个9,而对于所谓的摇一摇,附近等服务,可以定义低等级的可用性,例如两个9,这种构建方式,可以很大程度上节省成本 附:支付宝可用性架构演进 ? ? ? ? ? ? ? ? ? ? ? ? ? ?

    9.3K40发布于 2020-04-30
  • 来自专栏PHPer 进击

    MySQL - 可用性:少宕机即可用?

    我们之前了解了复制、扩展性,接下来就让我们来了解可用性。归根到底,可用性就意味着 "更少的宕机时间"。 老规矩,讨论一个名词,首先要给它下个定义,那么什么是可用性? 1 什么是可用性 我们常见的可用性通常以百分比表示,这本身就有其隐藏的意味:可用性不是绝对的。换句话说,100% 的可用性是不可能达到的。没错,这里可以这么肯定的说。 我们一般用 “9” 的个数来描述可用性。X个9表示在数据中心运行1年时间的使用过程中,各系统可以正常使用时间与总时间(1年)之比。 3 如何实现可用性 通过上面的分析,也许你已经发现了,我们可用性取决于两个时间: 应用的平均失效时间 应用的平均恢复时间 因此,提高可用性也可以从这两个方面入手。 4 总结 可用性用宕机时间 n 个 9 来衡量。 实现可用性从平均失效时间和平均恢复时间入手。

    1.9K20发布于 2019-05-13
  • MySQL集群:可用性DBMS

    作为预防措施,我们必须引入辅助DNS-DHCP服务器,该服务器必须配置为可用性模式(HA),以便在主服务器关闭时辅助服务器接管并处理传入的请求。 可用性的DNS服务器必须始终保持两台服务器中的数据库同步。而且,两个DHCP服务器都工作在主动 - 主动模式下,这样它们就可以将IP地址池分隔开,并且可以先后处理传入的DHCP请求。 为了创建可用性环境,如上所述,MySQL提供了两种解决方案。MySQL同步(replication)和MySQL集群。 他们运行mysqld守护进程并将其组合在一起形成一个集群,从而实现高性能(由于并行性)和可用性。这些节点处理所有传入的查询,与数据节点通信并提供对集群的应用程序访问。 运行原理 在MySQL集群的核心,有一个NDB(网络数据库)存储引擎,它实际上负责可用性环境和数据冗余。

    2.4K70发布于 2018-05-22
  • 来自专栏企鹅号快讯

    可用性的前生今世

    可用性(High Availability,简写为HA)是一个有着很长历史的话题。 大多数的HA解决方案主要依赖于硬件的冗余以及那些具有特殊目的的、被设计为更好地利用硬件的软件,虚拟化和云计算平台就属于早期的实现可用性的方法。 HA解决方案可能是很昂贵的,在企业的方案组合中,并不是所有的业务都需要处于同一个可用性水平,关键业务功能可能需要较高水平的可用性,而那些业务支持功能可能就不需要那么可用性。 -------------------------------------- HA的未来---软件定义存储 到目前为止,可用性一直是许多软件定义存储解决方案面临的挑战,因为传统的可用性故障转移机制需要使用特殊的硬件 这是可用性技术向前迈出的重要一步,因为不再需要专用硬件和定制硬件来实现快速可靠的故障转移。 最关键的是这两种技术都降低了可用存储云部署的成本。

    1.4K70发布于 2018-01-11
  • 来自专栏京程一灯

    如何创建可用性系统

    单点故障是任意基础设施的崩溃,设计并运行具有可用性的系统是避免停机的关键。 什么是可用性(high availability)? 可用性系统必须在发生故障时考虑数据安全。 网络:可用性系统的另一个可能的故障点是计划外的网络中断。为可能的故障制定冗余网络策略非常重要。 基本 HA 基础架构是什么样的? 基本可用性基础设施 我们如何实施可用性基础架构来确保网站保持在线状态呢? 可用性系统1中的浮动IP(1) ? 可用性系统1中的浮动IP(2) 在上面的示例中,有两个相同的服务器处于主从模式,其中托管了相同的网站。网站的 DNS 指向浮动 IP。 设计和实现可用性系统可能看起来很复杂。但它是现代系统的一个基本特征,企业、员工和客户都希望服务不被中断,并能保证 100% 的正常运行时间。

    1.2K30发布于 2019-08-06
  • 来自专栏须臾之余

    可用性(High Availability):Redis 哨兵是Redis官方的可用性解决方案

    自动发现 Sentinel 和从服务器 一个 Sentinel 可以与其他多个 Sentinel 进行连接, 各个 Sentinel 之间可以互相检查对方的可用性, 并进行信息交换。

    1.1K30发布于 2019-11-27
  • 来自专栏超级架构师

    可用性设计】 GCP 面向规模和可用性的设计

    当您跨故障域进行复制时,您可以获得比单个实例更高的聚合级别的可用性。有关更多信息,请参阅区域和可用区。 设计具有故障转移功能的多区域架构以实现可用性 通过将应用程序架构为使用分布在多个区域的资源池,并在区域之间进行数据复制、负载平衡和自动故障转移,使您的应用程序对区域故障具有弹性。 在这两种情况下,故障都应该引发优先级警报,以便操作员可以修复错误情况。服务组件应该在失败打开方面犯错,除非它给业务带来极大风险。 有关详细信息,请参阅服务可用性的计算。 启动依赖 服务启动时的行为与其稳态行为不同。启动依赖项可能与稳态运行时依赖项有很大不同。 实施具有自动故障转移的多区域架构以实现可用性。 使用负载平衡在分片和区域之间分配用户请求。 设计应用程序以在过载情况下优雅降级。提供部分响应或提供有限的功能,而不是完全失败。

    1.8K20编辑于 2022-08-26
  • 来自专栏Hadoop数据仓库

    HAWQ技术解析(十四) —— 可用性

    一、HAWQ可用简介         HAWQ作为一个传统数仓在Hadoop上的替代品,其可用性至关重要。通常硬件容错、HAWQ HA、HDFS HA是保持系统可用时需要考虑并实施的三个层次。 三、HAWQ文件空间与HDFS可用         如果在初始化HAWQ时没有启用HDFS的可用性,可以使用下面的过程启用它。 配置HDFS集群可用性。 收集目标文件空间的信息。 配置HDFS集群可用性 (1)HDFS HA概述         HDFS中的NameNode非常重要,其中保存了DataNode上数据块存储位置的相关关系。 (2)使用Ambari启用HDP的可用性(参考How To Configure NameNode High Availability)。 Review:确认主机的选择,并点击Next,如图9所示。 ? 图9 创建检查点:此步骤中提示执行两条命令,第一条命令把NameNode置于安全模式,第二条命令创建一个检查点,如图10所示。

    1.9K100发布于 2018-01-03
  • 来自专栏全栈程序员必看

    CAP原理和数据可用性

    数据可用性 数据可用性包括如下几个方面的含义 数据持久性 保证数据可以持久存储,在各种情况下都不会出现数据丢失。 CAP原理 CAP原理认为,提供数据服务的存储系统无法同时满足数据一致性(Consistency)、数据可用性(Availbility)、分区耐受性(Patition Tolerance,系统具有跨网络分区伸缩性 这三个条件,如图 在大型网站,数据规模总是急剧扩张的,因此可伸缩性即分区耐受性必不可少,规模变大以后,机器数量也会变得庞大,这时网络和服务器故障就会频繁出现,要想保证应用可用,就必须保证分布式处理系统的可用性 所以在大型网站中,通常会选择强化分布式存储系统的可用性(A)和伸缩性(P),而在某种程度上放弃一致性(C)。 一般来说,数据不一致通常出现在系统并发或者集群状态不稳定(故障恢复、集群扩容…)的情况下,应用系统给需要分不是数据处理系统的数据不一致性有所了解并进行某种意义上的补偿和纠错,一笔I安出现系统数据不正确

    66210编辑于 2022-08-26
  • 来自专栏性能与架构

    可用性方案Keepalived工作原理

    随着系统架构的逐渐演化,服务器的数量和结构会越来越复杂,例如web服务器集群的搭建,提高了系统的性能,同时也提高了系统维护的复杂度,我们需要对集群中各台服务器进行监控,来保证为用户提供服务的是正常运行的服务器,整体系统的可用性就至关重要 Keepalived提供了很好的可用性保障服务,它可以检查服务器的状态,如果有服务器出现问题,Keepalived会将其从系统中移除,当这台服务器可以正常工作后,Keepalived再将其放入服务器群中

    71140发布于 2018-04-02
  • 来自专栏性能与架构

    Redis 可用性解决方案

    Sentinel是Redis的可用性解决方案: 由一个或多个Sentinel实例组成的Sentinel系统可以监视任意多个主服务器,以及所有从服务器,并在被监视的主服务器进入下线状态时,自动将下线主服务器属下的某个从服务器升级为新的主服务器

    92390发布于 2018-04-02
  • 来自专栏大数据杂货铺

    配置 HMS 以实现可用性

    要在主实例出现故障时提供到辅助 Hive Metastore 的故障转移,您需要知道如何在 Cloudera Manager 中添加 Metastore 角色并配置属性。

    1.5K40发布于 2021-08-20
  • 来自专栏redis集群

    redis集群的可用性实现

    本文主要是讨论如何保证集群版可用。可用分为选择最佳的机器、修复节点故障、升级或者修复软件故障、让数据落地保存这几个方面。 除上面的几个方面保证可用性以外,数据的冷备也相当重要,当多台机器同时故障,就需要从冷备的数据中还原集群的数据。集群版本备份需要对每个节点进行备份,在备份的时候为了不影响业务,一般建议在备机上面备份。

    2.7K40发布于 2018-12-04
领券