首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏干货满满

    用更云原生的方式做诊断|大规模 K8s 集群诊断利器深度解析

    最后我们决定做一个更加云原生的诊断工具,使用 operator 实现集群跟诊断项的管理,抽象出集群跟诊断项的资源概念,以此来解决大规模 Kubernetes 集群的诊断问题,通过在中心下发诊断项到其他集群 ,用于在 Kubernetes 集群中执行诊断项以证明集群的各项功能是否正常,Kubeprober 有如下特点: 支持大规模集群 支持多集群管理,支持在管理端配置集群跟诊断项的关系以及统一查看所有集群的诊断结果 其实,Kubeprober 做的也是诊断 Kubernetes 集群这件事情,提供框架来编写自己的诊断项。 诊断项配置,诊断结果收集,未来也会解决大规模 Kubernetes 集群的运维问题。 可视化 Kubeprober 在多集群中根据 probe 的策略执行诊断项,会产生大量的诊断事件。

    80620编辑于 2022-05-19
  • 来自专栏运维开发故事

    AIOps系列 | 开发 K8s GPT 故障诊断工具

    前面我们介绍了 《开发 K8s Chat 命令行工具》,实现了通过和 Kubernetes 进行交互的方式进行运维,虽然文章中所描述的功能比较简单,但是可以以此进行扩展,丰富功能。 那本章,我们将在 《开发 K8s Chat 命令行工具》的基础之上,增加 Kubernetes 故障诊断工具,其主要功能点是: 获取集群的 event 时间,特别关注 warning 级别事件 然后进入对应的 (5)使用 k8scopilot.exe analyze event 进行分析验证 分析结果如下: 正在请求 AI 分析... 当然,这里只是诊断问题,还可以对其功能进行扩展,比如: 故障自愈: 结合 Function Calling 实现自动修复简单问题 增强分析: 增加更多诊断数据源(metrics、节点状态等) 实现历史问题匹配和知识库 可视化: 生成 HTML 格式的诊断报告 支持问题严重程度分级展示 最后 本文在《开发 K8s Chat 命令行工具》的基础上,进一步实现了 Kubernetes 故障诊断功能,核心思路是通过工具获取集群中

    31410编辑于 2025-08-15
  • 来自专栏开源部署

    K8S集群容器中集成arthas、netstat即时诊断分析工具

    背景: k8s 集群中,Java应用容器中添加即时工具分析诊断arthas、netstat 1.预先下载好arthas-packaging-3.1.1-bin.zip文件,在Dockerfile同目录下 jre的,会缺少dt.jar,tools.jar arthas工具会使用到;需要安装tini工具,因为默认java 应用跑在容器中会是1 pid号,arthas会无法调用) FROM openjdk:8- -Darms.licenseKey=fqkkah9ke2@1f6f53b91f6e3fd -Darms.appName=test-factoring-web -Darms.agent.env=ACSK8S -Darms.licenseKey=fqkkah9ke2@1f6f53b91f6e3fd -Darms.appName=test-factoring-web -Darms.agent.env=ACSK8S

    4.4K20编辑于 2022-07-28
  • 来自专栏CNCF

    技术漫谈 | 超好用的K8s诊断工具:kubectl-debug

    在K8s环境部署应用后,经常遇到需要进入pod进行排错。 今天为大家推荐一款K8s pod诊断工具,kubectl-debug是一个简单、易用、强大的 kubectl 插件, 能够帮助你便捷地进行 Kubernetes 上的 Pod 排障诊断。 kubectl-debug 包含两部分: kubectl-debug:命令行工具; debug-agent:部署在K8s的node上,用于启动关联排错工具容器; 工具安装(CentOS 7.5): # /contrib/helm/kubectl-debug 简单使用(K8s v1.15.0): # kubectl 1.12.0 或更高的版本, 可以直接使用: kubectl debug -h # 老版本的 agentless kubectl debug POD_NAME --agentless # 假如 Pod 处于 CrashLookBackoff 状态无法连接, 可以复制一个完全相同的 Pod 来进行诊断

    2.2K20发布于 2019-12-04
  • 来自专栏运维开发故事

    超好用的k8s中pod诊断工具:kubectl-debug

    今天为大家推荐一款K8s pod诊断工具,kubectl-debug是一个简单、易用、强大的 kubectl 插件, 能够帮助你便捷地进行 Kubernetes 上的 Pod 排障诊断。 TARGET_ID --pid=container:$TARGET_ID --ipc=container:$TARGET_ID busybox 这就是 kubectl-debug 的出发点: 用工具容器来诊断业务容器 kubectl debug POD_NAME --container=init-pod 2、假如 Pod 处于 CrashLookBackoff 状态无法连接, 可以复制一个完全相同的 Pod 来进行诊断 iftop -i eth0 interface: eth0 IP address is: 172.17.3.3 MAC address is: 52:54:be:83:3a:e4 使用 drill 诊断 12月 20 23:41 kube-flannel-ds-amd64-2xwqp.pcap 诊断 CrashLoopBackoff 排查 CrashLoopBackoff 是一个很麻烦的问题,Pod

    2.2K20编辑于 2021-12-21
  • 来自专栏devops_k8s

    Golang性能诊断

    针对Go应用,性能诊断工具主要分为两层: OS层面 Go应用层面(go tool pprof / trace /gc) 2 OS诊断 系统诊断,我们一般关注三个方面: CPU, Memory, I/O。 除了常用的 top、 ps、vmstat、iostat 等命令,还有其他 Linux 工具可以诊断系统问题,如 mpstat、tcpdump、netstat、pidstat、sar 等 更多Linux性能诊断工具如下图 2 @0.024s 6%: 0.004+3.4+0.010 ms clock, 0.032+1.4/4.5/5.3+0.085 ms cpu, 13->14->13 MB, 14 MB goal, 8 gc 3 @0.093s 3%: 0.004+6.1+0.027 ms clock, 0.032+0.19/11/15+0.22 ms cpu, 24->25->22 MB, 26 MB goal, 8

    1.7K20编辑于 2022-03-13
  • 来自专栏全栈程序员必看

    prophet Diagnostics诊断

    例子代码 https://github.com/lilihongjava/prophet_demo/tree/master/diagnostics # encoding: utf-8 import pandas 在这8年的时间序列中,这相当于11个总预测(训练数据是2007/12/10 – 2016/01/20,因为最后一个截止点也要预测365天,所有最后一个cutoff在2015-01-20,第一个cutoff

    1.1K20编辑于 2022-07-02
  • 来自专栏腾讯云数据库(TencentDB)

    数据库诊断不了的,腾讯大神来“诊断

    ` (`name`), KEY `idx_age` (`age`), KEY `idx_n_a` (`name`,`age`)) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4

    2.5K30发布于 2021-03-29
  • 来自专栏爱生活爱编程

    prophet Diagnostics诊断

    例子代码 https://github.com/lilihongjava/prophet_demo/tree/master/diagnostics # encoding: utf-8 import pandas 在这8年的时间序列中,这相当于11个总预测(训练数据是2007/12/10 - 2016/01/20,因为最后一个截止点也要预测365天,所有最后一个cutoff在2015-01-20,第一个cutoff

    1.6K10发布于 2021-01-14
  • 深入 Kubernetes 网络:实战K8s网络故障排查与诊断策略

    KubeSkoop 是一个容器网络问题的自动诊断系统。 KubeSkoop 提供了全链路一键诊断、网络站延迟分析和网络异常事件识别回溯的能力。 快速上手 一键诊断 skoop -s xxx.xxx.xxx.xxx -d xxx.xxx.xxx.xxx -p 端口号 --http # 执行诊断命令,指定来源目的,通过--http来让诊断结果通过本地 web服务提供 诊断完成后会输出诊断结果,可以以可视化的方式打开。 尝试使用 Kubernetes 工具进行诊断,例如 kubectl,以查看 Pod 和容器的状态和日志。 执行命令,查看容器的日志信息。

    4.5K32编辑于 2024-06-08
  • 来自专栏希里安

    探索k8sgpt:新一代AI驱动的Kubernetes诊断工具

    所以k8sgpt这个应用就出现了,这个项目源自于一位工作多年的资深SRE工程师,将多年积累的SRE经验融入项目中的分析器中,并且借助AI进行诊断分析,这样遇到k8s集群问题就能够帮助我们快速定位了。 官方描述:k8sgpt是一个用于扫描Kubernetes集群、诊断和分级问题的工具,它以简单的英语呈现问题。 官网 官方地址:https://k8sgpt.ai/ 项目地址:https://github.com/k8sgpt-ai/k8sgpt 文档地址:https://docs.k8sgpt.ai/ 官方示例 快速开始 环境:Ubuntu 20.04.5 LTS k8s集群版本:1.29.0 k8sgpt版本:0.3.27 安装命令: curl -LO https://github.com/k8sgpt-ai /k8sgpt/releases/download/v0.3.27/k8sgpt_amd64.deb sudo dpkg -i k8sgpt_amd64.deb 安装完成后显示如下: 需要一个调用openai

    1.3K10编辑于 2024-03-20
  • 来自专栏多媒体工具

    M3U8失效检测、播放异常诊断与FFmpeg解决方案

    M3U8链接失效检测与调试指南一、M3U8链接失效的核心检测方法1.1HTTP状态码验证基础检测:通过HTTP请求验证M3U8文件可达性,返回状态码200OK表示链接基本有效关键状态码解析:404NotFound curl-Ihttps://example.com/stream.m3u8#使用FFmpeg测试播放ffmpeg-headers"Referer:https://www.example.com"-iinput.m3u8 支持拖放检测、多线程验证与超时设置PHPM3u8解析库:遵循RFC8216标准,适合开发集成M3U8解析功能2.3浏览器开发工具网络面板分析:过滤.m3u8请求,检查响应状态与请求头实时监控:使用ChromeDevTools 的Performance面板记录播放过程中的网络请求三、常见问题诊断与解决方案3.1链接可达性问题问题现象可能原因解决方案间歇性403错误Referer限制添加Referer:https://example.com 、Referer)加密流处理:保存密钥文件时注意权限控制,避免泄露时效性管理:对于含令牌参数的链接,建议24小时内完成检测网络环境控制:测试时关闭VPN/代理,确保与用户真实环境一致通过上述方法可系统诊断

    73710编辑于 2026-01-25
  • 来自专栏AIoT技术交流、分享

    详解UDS CAN诊断:什么是UDS(ISO 14229)诊断

    目录 1、UDS诊断概念 2、UDS诊断组成部分 3、UDS诊断服务 ---- 之前讲解到CAN物理层和数据链路层的相关知识,这些属于ISO 11898-1、ISO 11898-2和ISO 11898- 1、UDS诊断概念 UDS(Unified Diagnostic Services,统一的诊断服务)诊断协议是在汽车电子ECU环境下的一种诊断通信协议。 2、UDS诊断组成部分 截止到2020年,UDS诊断由以下8个部分组成: ISO 14229-1-2020:规范和要求; ISO 14229-2-2013:会话层服务; ISO 14229-3-2012 14229-8-2020:时钟扩展外围接口实现的统一诊断服务(UDSonCXPI)。 ---- UDS诊断 ISO 14229 1~8整套协议-中英文最新版

    13.1K22编辑于 2022-11-22
  • 来自专栏数据和云

    故障诊断 | 系统级追踪诊断方法及案例分享

    这里加了一个标志,就是ofag=sync,加完这个标示之后,我们发现写磁盘的速度下降了,写2G的文件花了8秒,多用了60%的时间。这就是文件系统缓存的作用,文件系统缓存大大增加了主机的性能。

    1.7K30发布于 2018-03-08
  • 来自专栏架构驿站

    JVM诊断工具-Greys

    如果出现满足条件的情况,则我们会看到打印结果: `---+Tracing for : thread_name="http-nio-8003-exec-8" thread_id=0x7a;is_daemon

    1.6K40编辑于 2021-12-09
  • 来自专栏互扯程序

    java 诊断工具—— Arthas

    今天的主角就登场了,阿里巴巴最近开源出来的一个针对 java 的工具,主要是针对 java 的问题进行诊断---Arthas(阿尔萨斯) ? 这就是使用Arthas诊断出的效率问题 [滑稽] 是不是特别爽,有了这个工具,妈妈再也不用担心我优化问题了,哪里慢改哪里! 此脚本暂时只接受一个参数 pid,即只能诊断本机上的 Java 进程。 monitor/watch/trace相关 请注意,这些命令,都通过字节码增强技术来实现的,会在指定类的方法中插入一些切面来实现数据统计和观测,因此在线上、预发使用时,请尽量明确需要观测的类、方法以及条件,诊断结束要执行 e.printStackTrace(); } } } } 如下我做一个示例 ( 本人是基于 Window 10 , JDK 8

    2.1K10发布于 2018-11-22
  • 来自专栏iSharkFly

    Confluence 6 诊断

    当你对性能进行诊断或者希望知道是什么原因导致 Confluence 崩溃,你希望知道在 Confluence 内部是什么导致这些问题发生的。 这个时候系统的诊断信息能够帮助你获得更多的有关的这些信息。 通常情况下不是偶然发生的,诊断警告将会帮助你构建有关你 Confluence 站点表现的详细快照,然后帮助你来识别导致你这些问题的的症状。 我们将会提供为诊断信息提供 UI,请关注我们的站点来获得有关的更新。 有关诊断警告 系统诊断工具的作用是能够对系统的症状和表现进行持续的监控。 例如一个长时间运行的任务可能会在 5 分钟后触发一个警告,但是这个任务可能会在 8 分钟后完成。 诊断信息将会存储在数据库中,这些数据每  30 天后会删除。老的警告信息将会在 30 天后被自动清理。

    79340发布于 2019-01-30
  • 来自专栏火丁笔记

    如何诊断CDN故障

    某项目使用CDN做文件下载服务,最近不时有网友反馈下载出错,因为CDN是第三方提供的,且节点众多,所以诊断起来有点麻烦,必须想想招儿。 首当其冲的问题是如何确认CDN有哪些节点?

    1.7K30编辑于 2021-12-14
  • 来自专栏音视频专栏

    网络诊断方案选型

    这里的网络诊断主要是针对特定的域名或者ip,也就是说app的网络诊断是对当前网络到域名指向的服务端的连通性和带宽情况。 这里分几个层面来说。 首先是哪些信息用来诊断网络,其次这些信息的诊断选择什么工具,再次网络诊断出来的数据如何理解。最后还需要给网络状况一个标准,以便于用户理解这个网络问题。 2. 网络诊断的工具 常用的网络工具或者方式,包括ping、DNS、traceroute、网络测速 2.1.ping测试 ping命令是基于ICMP,是在网络层。 参考文章 [1] 移动端下各类诊断方法与工具 [2] Android 网络优化,使用 HTTPDNS 优化 DNS,从原理到 OkHttp 集成 [3] Android获得DNS地址 [4] DNS(二 )通过dig命令理解DNS [5] Android网络测试与诊断 [6] 通话前网络测速

    5K60发布于 2020-08-04
  • 来自专栏AIoT技术交流、分享

    CANoe UDS诊断测试

    CDD文件是基于 ASAM MCD-2D 标准格式的描述文件,提供了车辆诊断通信所需的详细描述,包括诊断服务、参数、PDU格式等。 在没有 CDD 文件的情况下,诊断测试通常依赖手动配置或脚本编写进行服务的调用。 这意味着,测试人员需要自行指定每个诊断服务的服务ID、参数ID、数据格式等。 如果没有CDD文件,就需要根据诊断问卷调查表在Diagnostics/ISO-TP Configuration窗口设置传输层和诊断层参数。 Addressing(诊断地址信息) 包括请求地址、物理寻址和功能寻址。一般来说,诊断地址以 0x7 开头。ECU 所支持的诊断服务通常都支持物理寻址。 根据诊断信息表设置“Timing”参数 “Timing” 参数需根据诊断信息表进行设置,通常由 OEM 或 ECU 开发方提供。

    3.1K11编辑于 2025-04-02
领券