首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏Devops专栏

    11-RabbitMQ高级特性-消息可靠性投递

    11-RabbitMQ高级特性-消息可靠性投递 消息的可靠投递 在使用 RabbitMQ 的时候,作为消息发送方希望杜绝任何消息丢失或者投递失败场景。 RabbitMQ 为我们提供了两种方式用来控制消息的投递可靠性模式。 我们将利用这两个 callback 控制消息的可靠性投递 案例 1. confirm 确认模式 1.1 工程搭建 创建一个空的 maven 工程 rabbitmq-producer-spring: 1.2 --消息可靠性投递(生产端) --> <!

    50630编辑于 2022-11-22
  • 来自专栏超级架构师

    可靠性工程】Microsoft 可靠性模式

    可用性以正常运行时间的百分比来衡量,并定义了系统正常运行和工作的时间比例。可用性受系统错误、基础设施问题、恶意攻击和系统负载的影响。云应用程序通常为用户提供服务水平协议 (SLA),这意味着必须设计和实施应用程序以最大限度地提高可用性。

    56220编辑于 2022-09-26
  • 来自专栏超级架构师

    可靠性工程】GCP 可靠性核心原则

    由于 SLO 是制定有关可靠性的数据驱动决策的关键,因此它们是站点可靠性工程 (SRE) 实践的焦点。 错误预算 错误预算计算为 100% – SLO 在一段时间内。 核心原则 Google 的可靠性方法基于以下核心原则。 可靠性是您的首要功能 新产品功能有时是您短期内的首要任务。 但是,从长远来看,可靠性是您的首要产品功能,因为如果产品速度太慢或长时间不可用,您的用户可能会离开,从而使其他产品功能变得无关紧要。 可靠性由用户定义 对于面向用户的工作负载,衡量用户体验。 100% 的可靠性是错误的目标 你的系统应该足够可靠,让用户满意,但又不能过于可靠,以至于投资不合理。定义设置所需可靠性阈值的 SLO,然后使用错误预算来管理适当的变化率。 当错误预算减少时,放慢速度并专注于可靠性功能。 设计和操作原则 为了最大限度地提高系统可靠性,以下设计和操作原则适用。在架构框架可靠性类别的其余部分中详细讨论了这些原则中的每一个。

    1.1K10编辑于 2022-09-26
  • 来自专栏技术从心

    kafka可靠性

    kafka最初是被LinkedIn设计用来处理log的分布式消息系统,因此它的着眼点不在数据的安全性(log偶尔丢几条无所谓),换句话说kafka并不能完全保证数据不丢失。

    56320发布于 2019-08-06
  • 来自专栏历史专栏

    【愚公系列】2023年11月 Java教学课程 206-RabbitMQ(消息可靠性保障)

    前言 消息可靠性保障是指在分布式系统中,确保消息在传输过程中不会丢失或重复处理,能够被正确地投递和处理的一种机制。 在一个分布式系统中,消息可能需要经过多个节点传输和处理,但由于网络不可靠性、硬件故障等原因,消息的传输和处理很可能会出现失误,如果没有应对措施,就会导致丢失消息和重复处理消息等问题,从而对系统的可靠性和稳定性带来影响 为了保证消息的可靠性,需要采用一些机制来保障消息的传输和处理,例如消息的确认机制、持久化机制、幂等性机制等。 这些机制的应用可以提高消息的可靠性,从而保证系统的稳定性和可靠性。 一、RabbitMQ的消息可靠性保障 1.消息补偿机制 RabbitMQ提供了一种称为消息补偿机制的机制,可以在一个消费者处理消息失败时,将消息重新发送到队列中,让另一个消费者重新处理该消息,从而保证消息的可靠性

    22910编辑于 2025-06-02
  • 来自专栏centosDai

    可靠性规则

    支持库和应用程序可靠性(例如正确使用内存和线程)的可靠性规则。 可靠性规则包括: 规则 描述 CA2000:丢失范围之前释放对象 由于可能发生异常事件,导致对象的终结器无法运行,因此,应显式释放对象,以避免对该对象的所有引用超出范围。

    77930编辑于 2022-02-26
  • 来自专栏超级架构师

    【架构质量】可靠性系列#1:可靠性与韧性

    可靠性与弹性——可靠性和弹性之间有什么区别,为什么重要? 2. 可靠性增强技术——以 DIAL 中的“D”和“A”为例,我们将研究一些可以纳入与发现和身份验证相关的设计中的可靠性增强技术。 4. 可靠性增强技术——以 DIAL 中的“I”和“L”为例,我们将研究一些可用于与错误和限制相关的设计中的可靠性增强技术。 我的目的是深入了解 Microsoft 如何看待可靠性以及我们为提高客户服务可靠性而采用的流程和技术。 那么什么是可靠性? 最后一点让我们明白了我认为可靠性和弹性之间的区别。 可靠性是云服务提供商追求的结果——它就是结果。弹性是基于云的服务能够承受某些类型的故障,但从客户的角度来看仍保持正常运行的能力。

    59010编辑于 2022-07-29
  • 来自专栏让技术和时代并行

    可靠性基础-冗余

    它是指对组件或系统进行复制,以提高整个系统的可靠性和可用性。分布式系统由多个组件组成,如果其中一个组件发生故障,整个系统都会受到影响。 它涉及拥有关键硬件组件的多个副本,例如: 电源 网卡 RAID存储 散热风扇 认识到系统可靠性和可用性的重要性,硬件制造商整合了冗余组件和功能,以最大限度地降低硬件故障影响整个系统的风险。 它提高了系统的可靠性、可用性和性能。虽然冗余有其好处,但它也带来了一些挑战,例如成本和复杂性。因此,在实施冗余时,必须权衡收益与成本,并确保冗余组件得到良好配置和维护。

    1K10编辑于 2023-10-09
  • 来自专栏超级架构师

    可靠性工程】GCP 定义您的可靠性目标

    您将了解如何迭代您定义的服务级别目标 (SLO),并使用错误预算来了解如果发布其他更新,可靠性可能会受到影响。 根据用户体验选择 SLI 并设置 SLO 本架构框架部分的核心原则之一是可靠性由用户定义。尽可能靠近用户测量可靠性指标,例如以下选项: 如果可能,请检测移动或 Web 客户端。 衡量服务器的可靠性应该是最后的选择。 例如,使用 Stackdriver Monitoring 监控 Compute Engine 实例。 您更改的速率会影响系统的可靠性。但是,频繁进行小幅更改的能力可以帮助您更快、更优质地交付功能。根据客户体验调整的可实现的可靠性目标有助于定义客户可以容忍的最大变化速度和范围(功能速度)。 有关更多信息,请参阅架构中心可靠性类别中的构建协作事件管理流程。 使用错误预算来管理开发速度 错误预算会告诉您您的系统在某个时间窗口内是否比所需的可靠性更高或更低。

    92520编辑于 2022-08-26
  • 来自专栏码上修行

    Kafka 消息可靠性

    在 Kafka 工作机制 一文提及了 Kafka 消息的不可靠性。本文就 Kafka 消息的三种不可靠性(重复、丢失、乱序),分析它们出现的内部原因和解决办法。 作者:王克锋 出处:https://kefeng.wang/2017/11/22/kafka-reliability/

    1.1K40发布于 2019-06-26
  • 来自专栏超级架构师

    可靠性测试】什么是可靠性测试:定义、方法和工具

    什么是可靠性测试? 可靠性定义为在特定环境中指定时间段内无故障软件运行的概率。 执行可靠性测试是为了确保软件是可靠的,它满足其目的,在给定的环境中指定的时间量,并能够呈现无故障运行。 在进行可靠性测试时,我们必须检查内存泄漏、电池电量不足、网络不足、数据库错误等环境限制。 衡量软件可靠性的基本类型 下面列出了一些衡量软件可靠性的基本类型。 在这里,我们可以预测产品在当前或未来时间的可靠性。这种类型的测试在软件开发生命周期的最后阶段执行。 可靠性测试工具 测试人员需要确定软件的可靠性估计。这将导致在软件可靠性中使用各种工具。 CASRE 可靠性测量工具基于现有的可靠性模型构建,有助于更好地估计软件产品的可靠性。该工具的 GUI 提供了对软件可靠性的更好理解,并且非常易于使用。 在 SDLC 中,可靠性测试起着重要的作用。如上所述,使用可靠性指标将为软件带来可靠性并预测软件的未来。很多时候,如果软件的复杂度很高,软件的可靠性就很难获得。 谢谢大家关注,转发,点赞和点在看。

    5K20编辑于 2022-09-28
  • 来自专栏企业平台构建

    RabbitMq可靠性分析

    当然我们所谓的可靠性主要指的以下几方面(个人认为): 生产消息时,如果broker处理成功/失败,是否一定会告知生产者 消息生产者告知消息发送成功/失败,是否broker也是一致 消息被消费,broker

    51920发布于 2019-08-07
  • 来自专栏后台技术底层理解

    消息队列的可靠性

    但是rabbitMQ事务操作太耗费性能,因为为了保证可靠性,需要同步等待机制,等待你成功。 confirm机制,先设置 channel 为confirm,如果接受到消息,回调这个接口,接受成功。

    95510发布于 2020-08-04
  • 来自专栏code-x

    RabbitMQRocketMQ消息可靠性保证

    发布者确认需要手动开启,默认是没有开启的,也就是说默认情况下我们消息发出去就完事儿了,但是服务端有没有成功处理并不一定,此时虽然消息发布成功但是broker可能并没有正确处理该消息导致消息丢失,所以为了消息的可靠性 broker的磁盘损坏仍然会导致数据丢失,而如果broker是集群部署的,如果集群中所有broker的磁盘都损坏,此时消息也会丢失,由于硬件故障是无法避免的,只能根据消息的重要性做集群,集群规模越大、磁盘可靠性越高

    72510编辑于 2022-11-17
  • 来自专栏蓝天

    测试 Linux 的可靠性

    LTC 尤其感兴趣的领域是 Linux 可扩展性、适用性、可靠性和系统管理 —— 所有的目的都是为了使 Linux 更适用于企业。 Linux 可靠性度量 目标 对 IBM Linux Technology Center 来说,Linux 可靠性工作的目标是,使用 LTP 测试套件对 Linux 操作系统进行超长时间的测试,重点在于 测试环境概述 本文描述的是使用 LTP 测试套件进行的 30 天与 60 天的 Linux 可靠性度量测试的测试结果和分析。 已知的 LTP 测试套件测试过的体系结构有 11 种,包括 i386、ia64、PowerPC、PowerPC 64、S/390、S/390x (64bit)、MIPS、mipsel、cris、AMD 我们的可靠性测试中使用的 LTP 版本是 20030524,这是当时可以获得的最新版本。

    2K30发布于 2018-08-07
  • 来自专栏全栈程序员必看

    可靠性测试的基础知识——可靠性的计算方法

    n个子系统组成,当且仅当所有的子系统都有能正常工作时,系统才能正常工作,这种系统称为串联系统 设系统各个子系统的可靠性分别用R1, R2, R3……, Rn表示,则系统的可靠性 R=R1×R2×R3×… 设系统各个子系统的可靠性分别用R1, R2, R3……, Rn表示,则系统的可靠性 R=1-(1-R1)×(1-R2)×(1-R3)×……×(1-Rn) 如果系统的各个子系统的失效率均为λ,则系统的失效率 ×(1-R2)×(1-R3)=1-(1-0.9)×(1-0.9)×(1-0.9)=0.999 系统失效率      μ = 1/((1/0.0001)*(1/1+1/2+1/3))=6/(10000*11 ) 系统平均故障间隔时间 MTBF=10000*11/6=18333 软件可靠性的X个9 X个9表示在软件系统1年时间的使用过程中,系统可以正常使用时间与总时间(1年)之比,一般都是3~5。 “可靠性”这个词;而6个9则表示一年内业务中断时间最多是31秒,那么这个级别的可靠性并非实现不了,而是要做到从5个9》6个9的可靠性提升的话,后者需要付出比前者几倍的成本,所以在企业里大家都只谈(3~5

    8K10编辑于 2022-09-06
  • 来自专栏后端码匠

    【RabbitMQ】消息可靠性投递

    RabbitMQ消息可靠性投递 什么是消息的可靠性投递?即保证消息百分百发送到消息队列中去,消息发送端需要接受到mq服务端接受到消息的确认应答。 是默认值,CORRELATED值是发布消息成功到交换器后会触发回调方法 publisher-confirm-type: correlated thymeleaf.cache: false 可靠性投递 return */ @GetMapping("/confirmCallback") public R confirmCallback() { log.info("可靠性投递 GetMapping("/returnCallback") public R returnCallback() { log.info("交换机到队列通过returnCallback 可靠性投递 INFO 4848 --- [nio-9090-exec-1] c.c.codingce.controller.SendController : 交换机到队列通过returnCallback 可靠性投递

    53550编辑于 2023-11-12
  • 来自专栏后端/图像融合/机器学习/爬虫

    RabbitMQ怎么保证可靠性

    前言 RabbitMQ相信大家都非常熟悉了,今天咱们来聊聊怎么保证RabbitMQ的可靠性。 那什么时候会出现问题呢? 第一种是生产端出现的问题。 总结 从生产端、RabbitMQ以及消费端三方面介绍了一下怎么保证RabbitMQ的可靠性,另外还有关于死信队列和延迟队列的内容在这篇博客中,大家有兴趣可以看一下。

    44510编辑于 2024-06-19
  • 来自专栏sql与spec性能

    pgsql的数据可靠性

    如何保证数据的可靠性pgsql的数据页大小是8K,linux文件系统页大小是4K或8K(getconf PAGE_SIZE查询),数据页大小是8K,磁盘扇区是512B,因此在数据页并发写入磁盘时每个io 由于写入扇区不同,可能因为传输或硬件故障等原因导致写入失败,一部分写入,一部分未写入;针对对数据可靠性要求较高的环境,可以通过full_page_writes和check_sum配置来保证数据的可靠性full_page_writes

    48920编辑于 2023-09-14
  • 来自专栏深度学习与python

    从谷歌 20 年的站点可靠性工程(SRE)中学到的 11 个经验教训

    11. 单一全球硬件版本会是单点故障 只使用一种特定型号的设备来执行关键功能可以简化操作并能使运维更简单。然而,这也意味着,如果该模型出现问题,则该关键功能将不再执行。 从谷歌 20 年的站点可靠性工程中汲取的 11 个经验教训。为什么是 11 个呢?好吧,你看,谷歌站点可靠性有着丰富的历史并仍然处于鼎盛时期。

    48740编辑于 2023-11-16
领券