暂无搜索历史
a) 哪些 Pod 发生丢包, 单个 or 多个 Pod/Node/Cluster , 分布规律: 发现丢包的 Pod ,集中在某个 Node 上面
📢 凌晨三点,刺耳的告警划破宁静! 手机疯狂震动: “Nginx虚拟机已重启!” 睡眼惺忪的我心里一沉——线上服务出事了!
注册中心是服务实例信息的存储仓库,也是服务提供者和服务消费者进行交互的桥梁。它主要提供了服务注册和服务发现这两大核心功能。
导语: 本以为是一次平平无奇的K8s集群升级:更高版本、更潮的操作系统(Ubuntu 22.04替换CentOS 7.9)。谁曾想,当业务迁移启动,部分Java...
下面我按工程视角,把 MCP / Agent / Skills / Rules 这几个概念的区别、作用、落地形态,以及它们与传统 API 调用的本质差异系统性说...
人类文明的每一次跃迁,本质上都是生产工具对人类感官与能力的延伸。从依靠肌肉劳动的农业经济,到蒸汽机释放体力的第一次工业革命,到电力点亮世界的第二次工业革命,再到...
2026年的春天,北京还没完全回暖,我坐在工位上,看着屏幕上 ChatGPT 又一次精准地写出了一段 Kubernetes 排障脚本。那一刻,说不焦虑是假的。
物理机硬件故障排查,本质是从现象 → 定位部件 → 交叉验证 → 最终确认的工程过程。 在数据中心环境中,应优先基于 带外管理 + 日志证据 + 最小干扰原则 ...
主要都是 kube-state-metrics 收集的, K8s 内置的资源对象 , 只需要添加启动参数即可
作为一名SRE,最深刻的成长往往源于“踩坑”后的反思。今天分享一次让我在面试中收获最多、成长最快的K8s故障复盘经历——一次由全局PID耗尽引发的Calico网...
以下是 PersistentPodState 系统的调谐逻辑和 webhook 拦截逻辑的流程图:
没了docker, 在容器里面运行应用跑测试,用 docker build 镜像等最基本的功能都不能用了,如何解?
前两篇文章,我们分别介绍 Kubevirt 的安装、基本使用 以及 将 oVirt 虚拟机迁移到 KubeVirt,我们留了两个ToDo,一个是本地磁盘的动态分...
错误关键词 Operation not permitted、nf_conntrack: table full, dropping packet,问题出现在 代理...
问题要点是:单点登录失败,看代码是 request 和 response 的 RedirectUri 不一样导致的。
上篇 6 张图带你深入了解 kube-scheduler ,已经知道 kube-scheduler 的工作流程,以及如何实现自定义插件。koordinator ...
2)同一时间如果有大量待调度的 Pod,如果处理,如果保证不能漏掉,应该先处理哪个 Pod,调度过程中,如果失败,如何处理, 所以得加个队列,有重试机制等
运维,这里指互联网运维,通常属于技术部门,与研发、测试同为互联网产品技术支撑的3大部门,这个划分在国内和国外以及大小公司间都会多少有一些不同。
上次发文 K8s 无备份,不运维!,文章开篇,插入了一张 K8s 集群巡检的图片,好多小伙伴私信留言,问我要开源地址。由于其通用性不高,大多数公司需要结合自身的...
受内核调度控制周期(cfs_period)影响,容器的 CPU 利用率往往具有一定的欺骗性,下图展示了某容器一段时间的 CPU 使用情况(单位为0.01核),可...
暂未填写公司和职称
暂未填写个人简介
暂未填写学校和专业