首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏运维开发故事

    K8s集群稳定性提升手段

    这时可以通过动态调整副本数,以高资源利用率承载业务的波峰波谷,可以参考k8s原生提供的HPA 。 这里暂时介绍利用k8s原生能力进行资源的划分和限制。 1.2.1 如何资源划分和限制 设想,你是个集群管理员,现在有4个业务部门使用同一个集群,你的责任是保证业务稳定性的前提下,让业务真正做到资源的按需使用。 此外,对于共享使用一个集群的团队/项目来说,他们通常都将自己容器的 Request 和 Limit 设置得很高以保证自己服务的稳定性。 集群稳定性提升手段,有很多,提升资源利用率只是某一种,后续还会继续输出其他手段的应用,还请持续关注,未完待续。。。

    93030编辑于 2022-04-05
  • 来自专栏Kubernetes

    【K8s】Kubernetes 稳定性之健康检查

    健康检查可以保障容器内应用程序的稳定性和可用性,并控制应用程序何时可以提供对外访问。

    52610编辑于 2024-09-11
  • 来自专栏新智元

    GAN最新进展:8大技巧提高稳定性

    、超分辨率、姿势转换,以及任何类型的图像翻译,例如下面这些: 使用 GAN 进行图像翻译 (Source: https://phillipi.github.io/pix2pix/) 然而,由于其无常的稳定性 8大技巧提高GAN性能 有很多技巧可以用来使 GAN 更加稳定或更加强大。这里只解释了相对较新的或较复杂的一些技术。 当然,使用 gradient penalty 可以帮助我们避开这些状态,大大增强稳定性,减少模式崩溃。 relativistic 方法也解决了这个问题,并取得了相当显著的效果,如下图所示: 经过 5000 次迭代后,标准 GAN(左) 和 relativistic GAN(右) 的输出 8、自注意力机制

    1.3K40发布于 2019-03-07
  • 来自专栏Kubernetes

    【K8s】Kubernetes 稳定性之自动扩缩容

    层面:根据业务规模,实现集群节点的自动扩缩容 Pod 层面:根据业务规模,实现 Pod 副本的自动扩缩容 自动扩缩容提供了以下好处: 提高资源利用率:根据实际需求动态调整资源,避免资源浪费 提高应用稳定性和可用性

    75410编辑于 2024-09-11
  • 来自专栏阿甘的码路2

    稳定性治理二,稳定性分析

    支付宝2015年发生了大规模的宕机事件,原因是杭州市萧山区某地光纤被挖断导致,为确保异地容灾、多活,后面专门进行了全链路单元化改造,整个交易链路都进行了单元化改造,并且经常在大促前夕进行单机房演练;

    89451编辑于 2023-08-17
  • 来自专栏韩曙亮的移动开发专栏

    【数字信号处理】离散时间系统稳定性 ( 稳定性概念 | 稳定性用法 )

    文章目录 一、离散时间系统稳定性 二、离散时间系统稳定性实际用法 一、离散时间系统稳定性 ---- 线性时不变 LTI 系统 , 如果 " 输入序列 " 有界 , 则 " 输出序列 " 也有界 ; 充要条件 : \sum^{+\infty}_{m = -\infty} |h(n)| < \infty 二、离散时间系统稳定性实际用法 ---- 实际用途 : 设计一个 滤波器 , 设计完 滤波器参数 后 ,

    3.9K30编辑于 2023-03-30
  • 来自专栏腾讯云原生团队

    万级K8s集群背后etcd稳定性及性能优化实践

    各类容器服务类型背后的核心都是K8s,K8s核心的存储etcd又统一由我们基于K8s构建的etcd平台进行管理。基于它我们目前管理了千级etcd集群,背后支撑了万级K8s集群。 在万级K8s集群规模下的我们如何高效保障etcd集群的稳定性? etcd集群的稳定性风险又来自哪里? 我们通过基于业务场景、历史遗留问题、现网运营经验等进行稳定性风险模型分析,风险主要来自旧TKE etcd架构设计不合理、etcd稳定性、etcd性能部分场景无法满足业务、测试用例覆盖不足、变更管理不严谨 为了解决以上挑战,避免集群过载目前我们通过以下方案来保障集群稳定性: 基于K8s apiserver上层限速能力,如apiserver默认写100/s,读200/s 基于K8s resource quota [6dd84d00c43067a7217498a5defae5f6.png] 本文简单描述了我们在管理万级K8s集群和其他业务过程中遇到的etcd稳定性和性能挑战,以及我们是如何定位、分析、复现、解决这些挑战

    4.7K8983发布于 2020-09-11
  • 来自专栏Kubernetes

    【K8s】Kubernetes 稳定性之资源限制及服务质量等级

    Kubernetes 是一个完全以资源为中心的系统,资源限制是通过 Cgroups 等控制 Pod 使用节点资源(CPU、内存、存储)的一种机制,对于确保 Kubernetes 集群运行的稳定、高效至关重要。通过合理配置资源限制,可以避免资源争用和过载,同时提高应用程序的可靠性和性能。

    44610编辑于 2024-09-11
  • 来自专栏腾讯云原生团队

    万级K8s集群背后etcd稳定性及性能优化实践

    各类容器服务类型背后的核心都是K8s,K8s核心的存储etcd又统一由我们基于K8s构建的etcd平台进行管理。基于它我们目前管理了千级etcd集群,背后支撑了万级K8s集群。 在万级K8s集群规模下的我们如何高效保障etcd集群的稳定性?  etcd集群的稳定性风险又来自哪里? 我们通过基于业务场景、历史遗留问题、现网运营经验等进行稳定性风险模型分析,风险主要来自旧TKE etcd架构设计不合理、etcd稳定性、etcd性能部分场景无法满足业务、测试用例覆盖不足、变更管理不严谨 为了解决以上挑战,避免集群过载目前我们通过以下方案来保障集群稳定性: 基于K8s apiserver上层限速能力,如apiserver默认写100/s,读200/s 基于K8s resource quota 总结 本文简单描述了我们在管理万级K8s集群和其他业务过程中遇到的etcd稳定性和性能挑战,以及我们是如何定位、分析、复现、解决这些挑战,并将解决方案贡献给社区。

    1.8K31编辑于 2022-04-14
  • 来自专栏贰叁壹运维

    持续稳定性考察

    药品的稳定性是指药品稳定保持其物理、化学、生物学性质及其疗效和安全性的能力。对药品的稳定性要求属于药品管理法规规范重点,各国的药典和新药注册审批等都对药品的稳定性研究有详细的规定。 依据考察目的的不同,上市产品稳定性考察可分为常规稳定性考察、刚上市产品的稳定性考察和特殊稳定性考察。 常规稳定性考察:针对正常生产条件下的常规产品而进行的持续稳定性考察。 新上市产品的稳定性考察:新产品上市,对正式生产销售前三批产品进行持续稳定性考察。 稳定性考察批次和取样时间点 常规稳定性考察:通常要求同一品种每个规格至少考察1批。对于稳定性较差(如容易降解)的产品,应该根据该产品历史稳定性数据适当增加考察批数。 稳定性数据的评价 稳定性考察有助于发现产品稳定性变化趋势,确保产品在运输、储存和使用过程中的质量。

    2.6K40发布于 2021-05-06
  • 来自专栏程序员升级之路

    Redis稳定性实践

    二、大促时稳定性保障 大促的时候因为流量比往常高几倍,甚至是几十倍,更需要保证系统稳定性

    1.6K31发布于 2020-09-11
  • 来自专栏图形化开放式生信分析系统开发

    图形化开放式生信分析系统开发 - 8 软件稳定性测试

    软件开发接近完成的时候,包括作者在内,都会有一个疑问:软件的稳定性如何?能否经受住高负载的考验?我的业务跑在上面,出问题怎么办?本文将使用稳定性测试的方法,解决以上疑问。 如何测试软件的稳定性? 测试方案如下 测试环境: 服务器端(软件部署端) CPU:I7 6700K 4 Core 8 Threads,4.8GHz 内存:64G 3200Mhz 硬盘:Intel 760P 512G 客户端 而且本软件性质不属于高并发类型的系统,日常使用和可以预见的场景不会有太多的并发用户,追求的反而是长时间的稳定性。 ? ​ 并在压力/稳定性测试结束后,系统仍在平稳运行。 ? ? 稳定性测试的结果: ? 经过这么严苛条件的稳定性测试之后,虽然也可能有个别测试盲区,但是这些数据从整体上已经足够判断一个软件的稳定性了。 SliverWorkspace产品PPT.pdf

    90200发布于 2020-01-17
  • 来自专栏MoeLove

    K8S 生态周报| Docker v20.10.5 发布,修复 Bug 及提升稳定性

    CoreDNS v1.8.3 发布 在之前的文章 K8S 生态周报| Helm v3.4 发布 中我介绍了 CoreDNS v1.8.0 版本相关的特性及变更,感兴趣的小伙伴可以复习一下。 #99158 支持为 Pod 设置 Sysctls 的特性现在已经 GA, 这是一个从 K8S v1.4 版本开始的功能,到 v1.11 的时候进入 Beta,如今正式 GA,并将在 v1.21 中公布 TheMoeLove 参考资料 [1] k8s生态: https://zhuanlan.zhihu.com/container [2] Docker ReleaseNote: https://github.com

    71900发布于 2021-03-16
  • 来自专栏斑斓

    软件系统的稳定性

    软件系统的稳定性,主要决定于整体的系统架构设计,然而也不可忽略编程的细节,正所谓“千里之堤,溃于蚁穴”,一旦考虑不周,看似无关紧要的代码片段可能会带来整体软件系统的崩溃。 软件系统的稳定性,主要决定于整体的系统架构设计,然而也不可忽略编程的细节,正所谓“千里之堤,溃于蚁穴”,一旦考虑不周,看似无关紧要的代码片段可能会带来整体软件系统的崩溃。

    7.8K60发布于 2018-03-07
  • 稳定性生产总结

    ​本期我们来谈下稳定性生产这个话题,稳定性建设目标有两个:降发生、降影响,在降发生中的措施是做到三点:系统高可用、 高性能、 高质量,三高问题确实是一个很热的话题,里面涉及很多点。 一、分布式系统稳定性建设模式那怎样完成降发生和降影响两个目标呢,那就需要一个好的建设模式,稳定性建设模式是指在开展稳定性建设工作过程中应重点关注的技术方法或方案,这里面有一系列技术模式来支撑稳定性能力实现 二、分布式系统稳定性建设路径那我们在实际工作中怎样进行建设呢?需要做两件事:需求分析和实现分析。(一)稳定性建设需求分析需求分析可以分为确认分析对象主体和确定服务需求两部分。 2、建设组织保障能力包括人力资源支持、技术资源支持、组织优化3、建设稳定性保障体系包括如下内容:​​在建设之后,我们可以依照如下指标来进行衡量建设的效果以上就是我们本期稳定性生产方面的内容了,故障的发生是复杂多样的 ,定义业务或者服务的slo以结构化,来保障稳定性能力。

    56501编辑于 2024-04-15
  • 来自专栏IT技术订阅

    Kafka 的稳定性

    8. Leader Epoch使⽤ 8.1 Kafka 解决方案 造成上述两个问题的根本原因在于 HW值被⽤于衡量副本备份的成功与否。 在出现失败重启时作为⽇志截断的依据。

    1.7K10编辑于 2022-06-23
  • 来自专栏云Elasticsearch Service

    ElasticSearch稳定性优化

    在内存回收方面消耗;2、高阶内存不足优化:整理碎片化内存,保证有充足高阶内存,降低CPU在内存碎片整理消耗;经过上述优化措施后,ES系统的读写成功率达到99.999%,超出当前的可用性要求,保障ES在生产环境稳定性

    1.2K51编辑于 2022-12-07
  • 来自专栏全栈程序员必看

    稳定性测试怎么做_stata稳定性检验怎么做

    稳定性对产品的重要性不言而喻。 而作为质量保障,在稳定性测试方面的探索也在不断演化。 稳定性测试的场景设计简单,和线上实际运行有较大的出入。带来的直接结果是稳定性测试发现的问题比较有限,做完之后仍然没有特别大的信心。 图片 那稳定性测试究竟该如何做?别人在怎么做? 02 对稳定性测试三个阶段的定义 目前稳定性测试采用的性能测试场景设计使用混合场景模式,基于产品业务模型或用户行为来定义场景,包括产品的典型业务、典型业务之间的组合关系、典型业务之间的比例等,这里不详细介绍 另外,关于稳定性测试场景的设计还有比较大的优化和提升空间,这个后面会畅谈下。 稳定性中增加异常手段的主要目的是为了验证系统在受到一些异常扰动时能否快速做出响应。

    1.4K20编辑于 2022-10-29
  • 来自专栏全栈程序员必看

    什么软件可以测试网络的稳定性,网络稳定性测试软件

    =======================================================================

    2.2K10编辑于 2022-09-30
  • 来自专栏程序员吾真本

    K8S下Istio就是检验微服务稳定性的混沌工程开源工具

    在K8S上部署的微服务,经常会依赖不受你控制的其他微服务。当两者之间的HTTP交互出现延迟或错误后,你的微服务能否按预期正常工作?应该做一个故障注入实验来检验一下。 如果在K8S上使用了Istio,那么恭喜你,你已经拥有了简单易用的混沌工程开源工具。 图片一句话介绍虽然Istio主要作为K8S服务网格,用于连接、保护、控制和观察服务,但在其流量管理功能中也支持故障注入。 适用平台K8S适用场景如果已经使用了 Istio,那么这可以直接用它在集群上运行混沌实验,而无需部署或学习其他工具。 否则,仅仅为了这两种故障注入功能就部署 Istio ,就不值了。 下检验微服务稳定性,还有什么好用的开源工具?

    44540编辑于 2023-08-12
领券