首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏全栈程序员必看

    istio框架(istio故障注入)

    注:它们Pod标签都有app: nginx,service服务发现根据这个标签选择,version是为后面定义版本设置的

    61830编辑于 2022-08-01
  • 来自专栏腾讯云混沌工程团队

    【云顾问-混沌】PodNode CPU 故障注入

    本文将介绍如何使用混沌工具对 Pod/Node 进行 CPU 负载故障注入,以达到指定的 CPU 负载百分比。 2. 参数 在进行 CPU 负载故障注入时,我们可以通过以下参数来控制: nice:指定 CPU 负载进程的 nice 值(静态优先级),取值范围为[-20, 19]。 实现原理 混沌工具在进行 CPU 负载故障注入时,主要通过以下方式实现: 启动 chaos_burncpu 进程,空跑 for 循环来消耗 CPU 时间片。 通过以上方法,我们可以轻松地对 Pod/Node 进行 CPU 负载故障注入,从而验证系统在不同负载下的表现,以及监控告警、流量调度、弹性伸缩等能力。 使用腾讯云混沌演练平台实施 CPU 高负载。

    92110编辑于 2024-03-15
  • 来自专栏猫头虎博客专区

    故障注入实验:了解如何使用Chaos Engineering的方法,在服务网格中进行故障注入实验

    在这篇博文中,我将带领大家探索如何在服务网格中进行故障注入实验,分享Chaos Engineering的最佳实践,并深入研究服务网格如Istio中的故障注入功能。 引言 混沌工程不仅仅是故意制造故障,而是一种科学的方法,通过故障注入来发现系统中的潜在问题,并验证系统的弹性。 服务网格,作为微服务架构的通信层,为我们提供了强大的故障注入工具,帮助我们更好地进行混沌实验。 正文 1. 什么是混沌工程? 混沌工程是一种通过主动注入故障来验证系统健壮性的方法。 2.1 Istio的故障注入功能 Istio允许我们在服务间的通信中注入故障,如延迟、错误等。 3.3 运行实验 使用服务网格的工具,如Istio,进行故障注入。 3.4 分析实验结果 收集实验数据,分析系统在故障下的表现,找出潜在的问题。 4.

    52910编辑于 2024-04-09
  • 故障注入在软件测试中实际应用

    一、为什么需要故障注入? 用户体验保障 确保前端在后端异常时友好提示 接口超时、CDN失效、图片加载失败 三、故障注入分类与工具选型 1. CPU 100% 30秒,模拟宕机# 同时运行SysBench压测sysbench oltp_write_only \ --mysql-host=proxy.xxx.com \ --threads=10 更新预案,沉淀知识└───────────────────────────┘六、关键成功要素 & 避坑指南✅ 成功要素:先小范围试点:从非核心服务开始,避免生产事故明确终止条件:设置自动回滚机制(如超时10 ❌ 无监控盲目注入 不知道系统是否真受影响 注入前建立基线,注入中实时看板❌ 一次性演练无闭环 问题重复发生 建立“发现→修复→验证”跟踪机制七、进阶:自动化故障注入流水线将故障注入融入

    86510编辑于 2025-09-17
  • 来自专栏腾讯云混沌工程团队

    【云顾问-混沌】PodNode 内存高负载故障注入

    本文将介绍如何使用混沌工具对 Pod/Node 进行内存负载故障注入,以达到指定的内存占用百分比。腾讯云混沌演练平台故障动作:标准集群 Pod/普通节点-内存利用率高。 2. 参数 在进行内存负载故障注入时,我们可以通过以下参数来控制: percent:内存使用率,取值是 0 到 100 的整数,默认值为 100。此参数为可选。 实现原理 混沌工具在进行内存负载故障注入时,主要通过以下方式实现: ram 模式:启动进程 chaos_burnmem 不断申请内存,模拟主机/容器内存负载升高。 为了保护该进程在故障注入期间一直存在,不被杀死,可以打开 oomGuard 保护,降低该进程 oom-kill 权重,优先杀死其他进程。 设置高负载的内存故障注入后,可能会使得机器无法登入与控制,请谨慎使用。 cache 模式:通过挂载 tmpfs 来实现内存占用。

    57310编辑于 2024-03-15
  • DeepSeek 3FS源码分析(1) 故障注入

    模拟故障 本文 DeepSeek 3FS 测试用例举例说明 我也也没看太明白 就是FAULT_INJECTION_SET(10, 5);宏函数搞定 一、设计原理 维度 Ceph 方式 3FS 方式 配置方式 • 3FS 的故障注入框架基于 概率触发 + 作用域管理 的设计,通过 folly::RequestContext 实现跨协程的配置传递。 cluster = this->createMockCluster(); auto &meta = cluster.meta().getOperator(); FAULT_INJECTION_SET(10 FAULT_INJECTION_SET(10, 5) 是一个用于故障注入测试的宏,它会在当前代码作用域内设置故障注入参数: FaultInjection.h:16 • 第一个参数 (10): 表示故障注入的概率为 10% FaultInjection.h:13 • 第二个参数 (5): 表示最多注入 5 次故障 FaultInjection.h:14 #define FAULT_INJECTION_SET(prob

    27510编辑于 2025-11-20
  • 来自专栏Godev

    外包精通--Istio流量管理之故障注入(二)

    本小节演示如何通过故障注入来测试应用的弹性。 1. 请注意reviews:v2服务有一个10s硬编码连接超时来调用ratings服务。即使您引入了7s延迟,您仍然希望端到端流能够继续,而不会出现任何错误。 创建一个故障注入的规则来延迟来自jason用户的流量。 正如预期的那样,您引入的7s延迟并不影响reviews服务,因为reviews和ratings服务之间的超时时间是硬编码为10s。 Istio的故障注入规则可以帮助您在不影响最终用户的情况下识别这些异常。 4.

    82270编辑于 2023-07-31
  • 来自专栏CNCF

    使用服务网格接口和Linkerd进行故障注入

    传统上,你需要在服务代码中添加某种类型的故障注入库,以便进行应用程序故障注入。值得庆幸的是,服务网格为我们提供了一种注入应用程序故障的方法,而无需修改或重新构建我们的服务。 这允许我们以一种与实现无关、跨服务网格工作的方式进行故障注入。 为此,我们首先部署一个只返回错误的新服务。 例如,通过将服务流量的10%发送给错误服务,我们向该服务注入了一个人工的10%故障率。 让我们来看一个使用Linkerd作为服务网格实现的实例。 metadata: name: error-injector-config 和部署它: > kubectl apply -f error-injector.yaml 现在我们可以创建一个流量分割资源,它将把10% service: error-injector weight: 100m 和部署它: > kubectl apply -f error-split.yaml 我们现在可以看到从webapp调用到书籍10%

    1.5K20发布于 2019-12-04
  • 来自专栏程序员吾真本

    K8S故障注入混沌工程开源平台ChaosMesh

    实验工作流 实验工作流,包括编排顺序或并行执行的故障注入实验,查看实验状态和结果,暂停实验,支持用YAML或Web UI定义和管理实验。 可视化操作 可视化操作,包括可以在Web UI上点击鼠标,定义实验的范围、故障注入类型和调度规则,最后能展示实验结果。 安全控制 安全控制,包括使用K8S原生提供的基于角色的访问控制功能,来管理故障注入的使用权限。还可以通过设置命名空间注解,来指定允许进行混沌实验的命名空间,进一步保障对混沌实验的控制。 使用K8S原生提供的基于角色的访问控制功能,来管理故障注入的使用权限。 劣势 只能在K8S集群上使用。否则,就只能使用针对节点进行故障注入实验的附带工具chaosd。 临时执行的实验会无限期地运行。 Apache-2.0 license GitHub点赞数 5.9k 最近发布日期与版本 2023.06: v2.6.1 所属项目 CNCF云原生计算基金会孵化项目 * * * 你还知道有什么好用的开源故障注入工具

    59820编辑于 2023-08-15
  • 来自专栏程序员吾真本

    K8S故障注入混沌工程开源平台ChaosMesh

    实验工作流 实验工作流,包括编排顺序或并行执行的故障注入实验,查看实验状态和结果,暂停实验,支持用YAML或Web UI定义和管理实验。 可视化操作 可视化操作,包括可以在Web UI上点击鼠标,定义实验的范围、故障注入类型和调度规则,最后能展示实验结果。 安全控制 安全控制,包括使用K8S原生提供的基于角色的访问控制功能,来管理故障注入的使用权限。还可以通过设置命名空间注解,来指定允许进行混沌实验的命名空间,进一步保障对混沌实验的控制。 使用K8S原生提供的基于角色的访问控制功能,来管理故障注入的使用权限。 劣势 只能在K8S集群上使用。否则,就只能使用针对节点进行故障注入实验的附带工具chaosd。 临时执行的实验会无限期地运行。

    60430编辑于 2023-08-16
  • 云顾问混沌演练平台:如何精准实现容器负载类故障注入

    腾讯云云顾问混沌演练平台应运而生,通过精准的负载类故障注入,帮助企业提前发现并解决问题,提升系统稳定性。1. 什么是负载类故障注入? 负载类故障注入主要模拟系统在极端资源消耗情况下的表现,例如CPU满载、内存耗尽、IO压力过大等情况。这类故障注入帮助企业验证容器在资源紧张情况下的响应能力和弹性扩展机制。2. 具体步骤如下:动态部署混沌辅助执行Pod: 混沌工程控制平台接收到用户的故障注入请求后,会在目标业务容器所在的节点动态启动一个chaos-helper-pod,这个Pod内置了各种故障注入工具,如CPU 对操作系统的要求腾讯云云顾问混沌演练平台在执行此类故障注入时并不直接依赖目标容器内的操作系统环境,因此对操作系统本身无特殊要求。 小结腾讯云云顾问混沌演练平台通过其创新的PID迁移机制和独立的辅助执行环境,实现了容器负载类故障注入的精确控制,确保故障注入的效果真实、准确,同时保障了混沌平台自身运行的稳定性,成为企业提升容器应用弹性和可靠性的重要利器

    41921编辑于 2025-05-20
  • 来自专栏陈冠男的游戏人生

    开箱PowerShorter:给国内安全爱好者的故障注入设备

    PowerShorter 是为电压短路故障注入定制的一款专用设备,可实现被测设备的瞬时短路,干扰设备正常运行 戳这里了解什么是故障注入 设备已经上架淘宝啦,直接在淘宝搜索 PowerShorter 就能购买嗷 如果想要控制电磁继电器的话可以使用 RELAY2,执行这两条语句后会听到啪嗒啪嗒的声音,这就是电磁继电器吸合的响动 控制固态继电器通断只需要修改为 RELAY1 即可 同理,控制 GPIO 的方式是: 接下来介绍一下故障注入最重要的参数控制 例如这里的 [(0, 3000), (1, 200), (0, 1)] 就表示收到触发信号后,短路引擎保持断开状态 3000 * 10ns,然后执行短接 200 * 10ns,最后保持断开 1 * 10ns ,如果后续不再操作将一直保持断开状态 这背后实际是控制 MOS 管对 E1 的 + 和 - 进行断开或短接,从而实现电压短路故障注入 后面三个参数分别是: 配置触发边沿是上升沿还是下降沿(默认为上升沿触发 的短路,红灯也又亮了起来 对于故障注入来说,统计故障参数及结果是很有必要的,这样我们可以有参考的调整参数,统计结果可以使用 FaultViz 这个库 https://gitee.com/osr-tech

    57720编辑于 2024-09-25
  • 来自专栏程序员吾真本

    7个检验软件系统稳定性场景的混沌工程故障注入开源工具ChaosBlade

    ChaosBlade可针对多达7个场景开展故障注入实验,但网上官方的中英文文档质量欠佳,内容缺失,真心没有站在一般用户的角度来写,只能通过运行blade命令的help了解究竟有什么功能。 图片 一句话介绍 ChaosBlade是阿里巴巴开源的针对7个检验软件系统稳定性场景的混沌工程故障注入开源工具:主机基础资源、CRI容器、K8S平台、Java应用、C++应用、阿里云平台、其他服务。 优势 支持多达7个故障注入场景。 劣势 网上的中英文文档描述过于简略。每个功能往往就一句话。只能把工具装上,运行起来,通过help参数,逆向工程来发现有什么功能。 Apache-2.0 license Github点赞数 5.4k 最近发布日期与版本 2023.05: v1.7.2 所属项目 CNCF云原生计算基金会沙箱项目 * * * 你还知道有什么好用的开源故障注入工具

    1.1K00编辑于 2023-08-12
  • 来自专栏程序员吾真本

    故障创建与编排更胜一筹的K8S混沌工程开源平台Litmus

    可安排单次或 Cron定时故障注入场景。可以用例优先级标注故障注入实验。 ChaosHub故障注入实验市场 Litmus拥有ChaosHub这个开源故障注入实验市场,托管 Litmus 所提供的各种故障注入实验。 这些实验是声明性的,并且可以根据需要进行调整。 混沌工程可观测性 可连接数据源(来自任何 Chaos Delegate)并监控故障注入场景。能可视化故障注入场景运行的统计数据和并做数据聚合。可比较两个或多个故障注入场景的观测数据。 故障注入场景管理 支持使用基础设施即代码的 GitOps 实现故障自动注入。允许从自定义镜像服务器(公共和私有)添加镜像。可测量并分析每个故障注入场景的韧性分数。 开源许可证 Apache-2.0 license GitHub点赞数 3.8k 最近发布日期与版本 2023.07: 3.0.0-beta10 所属项目 CNCF云原生计算基金会项目

    55410编辑于 2023-08-16
  • 来自专栏程序员吾真本

    故障创建与编排更胜一筹的K8S混沌工程开源平台Litmus

    可安排单次或 Cron定时故障注入场景。可以用例优先级标注故障注入实验。 ChaosHub故障注入实验市场Litmus拥有ChaosHub这个开源故障注入实验市场,托管 Litmus 所提供的各种故障注入实验。 这些实验是声明性的,并且可以根据需要进行调整。 混沌工程可观测性可连接数据源(来自任何 Chaos Delegate)并监控故障注入场景。能可视化故障注入场景运行的统计数据和并做数据聚合。可比较两个或多个故障注入场景的观测数据。 故障注入场景管理支持使用基础设施即代码的 GitOps 实现故障自动注入。允许从自定义镜像服务器(公共和私有)添加镜像。可测量并分析每个故障注入场景的韧性分数。 开源许可证Apache-2.0 licenseGitHub点赞数3.8k最近发布日期与版本2023.07: 3.0.0-beta10所属项目CNCF云原生计算基金会项目* * *你还知道有什么好用的开源故障注入工具

    95070编辑于 2023-08-15
  • 来自专栏喵了个咪的博客空间

    三, 跨语言微服务框架 - Istio官方示例(自动注入.请求路由.流量控制.故障注入)

    基础的Istio环境已经搭建完成,我们需要开始了解Istio提供作为微服务网格的各种机制,也就是本文标题的自动注入.请求路由.故障注入.流量切换,官方很给力的准备的实例项目也不需要大家自己编写demo来进行测试 由于 reviews:v2 服务对其 ratings 服务的调用具有 10 秒的硬编码连接超时,比我们设置的 7s 延迟要大,因此我们期望端到端流程是正常的(没有任何错误)。 在 productpage 和 reviews 服务之间超时时间是 6s - 编码 3s + 1 次重试总共 6s ,reviews 和 ratings 服务之间的硬编码连接超时为 10s 。 Istio 的故障注入规则可帮助您识别此类异常,而不会影响最终用户。 PS : 请注意,这里仅限制用户 “jason” 的失败影响。如果您以任何其他用户身份登录,则不会遇到任何延迟。 4.2 HTTP abort进行故障注入 测试微服务弹性的另一种方法是引入 HTTP abort 故障,如果异常中断那么需要做出对应的处理。

    1K10发布于 2019-05-26
  • 来自专栏golang算法架构leetcode技术php

    mac 上学习k8s系列(36)istio part IV 内外路由和故障注入

    networking/virtual-service-reviews-test-v2.yaml virtualservice.networking.istio.io/reviews created 或者进行故障注入 destination: host: reviews subset: v1 如何headers的end-user 字段匹配了jason就走v2的reviews 接着我们看下如何做故障注入

    51520编辑于 2022-08-02
  • 来自专栏k8s技术圈

    蚂蚁开源的云原生混沌工程平台 - ChaosMeta

    ,或者对云上/云下的目标进行管理以及注入故障,都有相应的部署方案可以满足 丰富的故障注入能力,云原生混沌工程 由于蚂蚁集团对攻防演练的高度重视,促成了大规模高频率的演练活动,进而推动了各种各样的故障注入能力建设 举个例子,比如一次演练的故障效果预期是某个服务的请求成功量下跌50%,并且预期对应的防御平 台能5分钟内发现并且10分钟内恢复,执行手段是通过CPU打满实现。 当前版本的能力 当前版本发布了:用户界面、故障注入调度引擎、度量引擎、流量注入引擎、单机故障注入工具等组件 用户界面 提供实验编排能力,降低使用门槛(当前版本的界面暂未支持流量注入类型和度量类型节点); && python -m SimpleHTTPServer 8080 > server.log 2>&1 & curl 127.0.0.1:8080 # 创建一个实验,给lo网卡注入2s网络延迟,10 分钟后自动恢复 chaosmetad inject network delay -i lo -l 2s --uid test-fg3g4 -t 10m # 查看实验信息,测试效果 chaosmetad

    2.3K10编辑于 2023-11-27
  • 来自专栏飞鸟的专栏

    使用istio进行限流以及模拟故障

    在 Istio 中,可以使用其流量管理功能来进行限流和故障注入。限流Istio 提供了一种称为 EnvoyFilter 的功能,它允许您在流量通过 Envoy 代理时执行自定义逻辑。 generic_key: descriptor_value: productpage stage: 0 max_tokens: 10 fill_interval: seconds: 1此配置文件将每秒限制 productpage 服务的流量,最多只能有 10 个请求。 模拟故障在 Istio 中,您可以使用故障注入来模拟服务故障,以测试系统的弹性和可靠性。Istio 提供了一些内置的故障注入功能,例如延迟、故障率和中断。 您可以使用 Istio 的 VirtualService 和 DestinationRule 资源来配置故障注入规则。

    1.2K10编辑于 2023-03-29
  • 来自专栏腾讯云智能顾问

    【云顾问-混沌演练】精细演练,稳定云端——腾讯云助阵金蝶云,守护小微业务稳定高可用

    本次演练主要针对金蝶小微业务线(精斗云&KIS云),涉及10大业务故障场景,是财务、新零售、电商等领域行业提高系统可用性的一次最佳实践。 事中演练: ○ 本次演练全程借助云顾问·混沌演练平台进行故障注入,演练开始后,负责人逐个点击执行故障注入和故障恢复; ○ 故障注入后由金蝶各业务负责人观察故障对业务的具体影响,监控数据&告警是否正常触达等 执行故障注入 云顾问·混沌演练平台提供可视化视图,用户在演练过程中可以实时查看故障动作执行状态(成功/失败/执行中)和注入效果: 观测监控指标 在故障注入过程中,通过平台集成的监控面板,对演练对象实例监控指标进行观测 ,比如:故障注入后XX服务显示故障,其他服务正常;故障回滚后,XX服务恢复正常。 故障注入后部分服务受到影响,收到系统告警提示,故障恢复后告警停止等。

    72510编辑于 2024-03-12
领券