搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏让技术和时代并行
Kubernetes排障指南
6）OCI runtime create failed 12月 09 08:56:41 k8s-client1 kubelet[39382]: E1209 08:56:41.691178 39382
4.5K30发布于 2019-12-13
来自专栏腾讯云容器专家服务的专栏
POD异常排障
pod 处于以上情况，可通过kubectl describe pod -n<namepsaces> <podname> 查看对应event 展示信息，基于对应报错信息进行解决；
1.4K20发布于 2021-10-28
来自专栏云计算专栏
云上如何玩转IPV6排障工具？
全球IPv4地址耗尽到底是怎么回事，全球IPv4地址耗尽后对我们有什么影响，IPv6又是什么？我们如何玩转IPV6排障工具？ 0.png IPv6介绍： 0.jpg IPv6标准报头中主要字段解释如下： Version：版本号，长度为4bit。对于IPv6，该值为6。 Traffic Class：流类别，长度为8bit。 IPV6公网地址足够多，可以直接给终端分配独立的全球IPV6公网地址，真正实现端到端更透明，成本更低。 IPv6排障工具： ping6测试网络连通性：图片.png 图片.png dig查看一个域名是否具有AAAA记录：图片.png telnet对应IPv6地址端口是否正常：图片.png mtr测试 curl模拟测试IPv6业务请求：图片.png 查看系统内IPV6路由表：图片.png 本文主要介绍IPV6的一些基础知识，后续文章将会一步步深入分析具体案例！
1.5K31发布于 2019-12-20
来自专栏云知识学习
kubernetes 基础集群排障
,"reference":{"kind":"ReplicaSet","namespace":"default","name":"nginx-2217866662","uid":"c08076ec-5a6a 2217866662 Containers: nginx: Container ID: docker://4fb98d7d4241f908695181b124096025d1bc6ba4f74065519c82b86ea8bd635d kube-system logs $PODNAME -c kubedns I0518 06:35:55.598577 1 dns.go:48] version: 1.14.3-4-gee838f6
3K120发布于 2018-05-18
来自专栏嘉为动态
跨越前后端排障鸿沟，精准排障，让IT人员不“撕逼”
我们以一些典型的场景为切入，来看看排障定位为什么会出现如此困境：01. 运维痛点——排障过程存在困境1）单点用户排障流程过去传统运维单点排障的工作实录：用户纷至沓来，客服电话被打爆，运维人员看看堆积如山的工单汗如雨下。只能一个个工单进行故障排查。 2）前端排障原理与流程当然，随着代码技术的不断演进，现在的程序员一般是不会一行一行的去排查代码的，不然动辄上万行的代码，如此去排障，运维人员、前后端人员早就“崩溃”了。为防止前后端的“撕逼”，我们需要从什么角度去建立前端监控体系，保证前后端的工作定位准确，精准排障呢？03. 对症下药——跨越障碍实现精准排障从用户端来看，任何一个角度出现问题，都会导致用户的体验不佳，导致流失。
82520编辑于 2023-03-29
来自专栏腾讯云可观测专栏
Kubernetes 排障实战：用 Prometheus 提升集群可用性和排障效率
得到上述指标后，便可灵活定义自己的业务和应用监控大盘：我们也可以使用 PromQL，灵活定义告警规则，例如我们可以定义一个关于订单支付延时的告警： K8s 排障实践接下来，我们将一起探讨常见的 Kubernetes 故障及其根因，并从具体案例出发，分析如何借助 Prometheus，对 K8s 进行全面排障。排障案例如果我们采访 K8s 运维工程师，问他们最常见、最头疼的 K8s 故障是啥，那么遥遥领先的必然是这俩： Pod 处于 pending 状态。 test get pods NAME READY STATUS RESTARTS AGE test-1c6sbc7b9e-d5sch 满足您全链路、端到端的统一监控诉求，提高运维排障效率，为业务的健康和稳定保驾护航。
1.3K10编辑于 2025-02-11
来自专栏云+技术
网站排障分析命令
系统连接状态篇： 1.查看TCP连接状态 netstat -nat|awk'{print$6}'|sort|uniq-c|sort-rnnetstat-n|awk'/^tcp/{print$NF}'|sort "$4}'|sort|uniq-c|sort-nr|head-20 6.根据端口列进程 netstat -ntlp|grep 80|awk'{print$7}'|cut-d/-f1 网站日志分析篇1（
55630发布于 2019-04-09
来自专栏云计算专栏
IPv6排障工具之ping6完整过程细节剖析
实现ping主要通过ICMP协议，而实现ping6是通过ICMPV6协议，那么什么是ICMPv6呢？一个完整的ping6的过程究竟是怎样的呢？ (作者：腾讯云售后架构师李彬文) 一、ICMPv6简介 ICMPv6（Internet Control Message Protocol for the IPv6）是IPv6的基础协议之一。二、ICMPv6报文格式 ICMPv6报文格式如下图所示。图片.png ICMPv6属于OSI七层协议栈的网络层，虽然和IPv6属于同一层，但是封装时必须先封装IPv6报文头部。三、ICMPv6差错报文 ICMPv6差错报文用于报告在转发IPv6数据包过程中出现的错误，可以分为以下4种： 1）目的不可达错误报文：在IPv6中间设备转发IPv6报文过程中，当设备发现目的地址不可达时，Code字段的值为0，然后交给IPv6协议封装； Step3：IPv6协议在ICMPv6基础上增加IPv6头部：（网络层封装）图片.png 封装的源IPv6地址是接口网卡v6地址：2402:4e00
8.6K637发布于 2020-01-14
来自专栏腾讯技术工程官方号的专栏
Redis延迟问题全面排障指南
这时我们还是需要一个全面的排障流程，不能无厘头地进行优化；全面的排障流程可以帮助我们找到真正的根因和性能瓶颈，以及实施正确高效的优化方案。这篇文章我们就从可能导致 Redis 延迟的方方面面开始，逐步深入排障深水区，以提供一个「全面」的 Redis 延迟问题排查思路。排障事大，但咱也不能冤枉了Redis；首先我们还是应该把其它因素都排除完了，再把焦点关注在业务服务到 Redis 这条链路上。导致 Redis Latency 的具体原因如果使用我们的快速清单并不能解决实际的延迟问题，我们就得深入 redis 性能排障的深水区，多方面逐步深究其中的具体原因了。总结 Redis 排障是一个循序渐进的复杂流程，涉及到 Redis 运行原理，设计架构以及操作系统，网络等等。
2.9K52编辑于 2023-04-29
来自专栏Windows技术交流
腾讯云Window日常排障参考
①安装微软Sysmon并启用 analytic and debug logging
59910编辑于 2025-03-21
来自专栏网络工程师笔记
排障不翻车 | 网络工程师必收藏的排障命令大全。附下载！
以下是30个常用的排障命令附带详细说明和一些用于华为网络设备的命令示例以帮助小白网络工程师更好地理解： 1. Ping测试： • 方法：使用ping命令测试目标设备的连通性。 6. 路由表和ARP表检查： • 方法：查看路由器上的路由表和ARP表。
76510编辑于 2023-11-27
来自专栏jeremy的技术点滴
kubernetes中基础服务排障记
8.0/en/forcing-innodb-recovery.html InnoDB: about forcing recovery. 15:24:36 UTC - mysqld got signal 6 0xd58441] /lib/x86_64-linux-gnu/libpthread.so.0(+0x11390) [0x7f1cae617390] /lib/x86_64-linux-gnu/libc.so.6( gsignal+0x38) [0x7f1cacb0a428] /lib/x86_64-linux-gnu/libc.so.6(abort+0x16a) [0x7f1cacb0c02a] /home/mdcallag +0xb8c80) [0x7f1cad476c80] /lib/x86_64-linux-gnu/libpthread.so.0(+0x76ba) [0x7f1cae60d6ba] /lib/x86_64 -linux-gnu/libc.so.6(clone+0x6d) [0x7f1cacbdc41d] The manual page at http://dev.mysql.com/doc/mysql/en
2.7K20发布于 2019-06-13
建设大模型训练排障平台：
建设大模型训练排障平台是提升训练效率、降低运维成本、保障研发进度的关键基础设施。以下是构建这样一个平台的系统化方案：一、核心建设目标故障快速定位：分钟级定位硬件/软件/算法故障根源训练过程透明化：实时监控千卡级集群训练状态智能预警：提前发现潜在故障风险（如梯度异常）知识沉淀：构建可复用的排障知识库二
27310编辑于 2025-08-15
来自专栏颇忒脱的技术博客
Kublet PLEG不健康问题排障
排查： kubectl get pods --all-namespaces 发现有一个istio-ingressgateway-6bbdd58f8c-nlgnd一直处于Terminating状态，也就是说杀不死 E0218 01:21:30.654433 10311 generic.go:271] PLEG: pod istio-ingressgateway-6bbdd58f8c-nlgnd/istio-system 再到Node上检查这个容器是否真的被停止，docker ps -a| grep ingressgateway-6bbdd58f8c-nlgnd，看到容器处于Exited状态。
6.8K20发布于 2019-03-13
来自专栏johnnyxsu技术交流分享
玩转CVM之Cloud-Init排障
rm -rf /var/lib/cloud 3、cloud-init init --local 4、cloud-init init 5、cloud-init modules --mode=config 6、 Windows Cloud-Init 排障思路确认Windows Server内部 cloudbase-init 服务是正常运行 1、登录虚拟机（如果忘记密码或者因为cloudbase-init 服务异常重置密码失败了 6、如果以上多已经排查正常了，查看下cloudbase-init日志看看是否有异常： image.png 从下往上慢慢翻看看是否有什么报错（重点关注出问题那次启动的时间）。
7.2K1842发布于 2019-07-16
来自专栏玉龙小栈
网络中出现故障该如何排障？具体排除流程有哪些？【网络排障连载01】
网络工程师经常接到各种求助电话，例如“电脑突然无法上网” 、“网页无法正常显示”、“游戏没法玩了”…… 报告故障：主动沟通确认在电话里询问用户上面的内容，并记录在排障报告中。逐一排查在逐一排查阶段同样需要平衡解决问题的迫切性与引入新故障的风险性之间的矛盾。所以，应该明确告知用户排查工作可能带来的风险，并在得到许可的情况下才能执行操作。有些情况下，通过逐一排查验证推断的过程涉及到网络变更，这时必须做好完善的应急预案和回退准备。解决故障如果通过逐一排查找到了故障的根本原因，并排除了故障，网络故障排除的流程就可以结束了。
2.2K20编辑于 2022-04-18
来自专栏Kevinello的技术小站
Redis实战：延迟问题排障指南
Redis 执行 GET、SET、DEL 命令耗时也很久为什么我的 Redis 突然慢了一波，之后又恢复正常了为什么我的 Redis 稳定运行了很久，突然从某个时间点开始变慢了这时我们还是需要一个全面的排障流程，不能无厘头地进行优化；全面的排障流程可以帮助我们找到真正的根因和性能瓶颈，以及实施正确高效的优化方案这篇文章我们就从可能导致 Redis 延迟的方方面面开始，逐步深入排障深水区，以提供一个「全面」的当某进程又需要这些数据且OS发现还有空闲物理内存时，又会把SWAP分区中的数据交换回物理内存中，这个过程称为SWAP IN，详情可参考这篇文章redis 监控指标合理完善的监控指标无疑能大大助力我们的排障系统引起的延迟比在物理机上也要高得多结果就是，即使 Redis 在亚微秒的时间级别上能处理大多数命令，网络和系统相关的延迟仍然是不可避免的Redis实例所在的机器带宽不足 / docker网桥性能问题等排障事大启用并使用 Redis 的延迟监控功能，更好的监控 Redis 实例中的延迟事件和原因导致Redis Latency的具体原因如果使用我们的快速清单并不能解决实际的延迟问题，我们就得深入 redis 性能排障的深水区
1.6K122编辑于 2023-03-05
来自专栏Cyylog技术
Tomcat__05_JVM_排障工具
JVM 运维实用排障工具 1、jps 用来查看Java进程的具体状态, 包括进程ID，进程启动的路径及启动参数等等，与unix上的ps类似，只不过jps是用来显示java进程，可以把jps理解为ps的一个子集 gen） NHMAX：最大可用的非 heap 大小 CPU：CPU 的使用情况 GC：消耗在 GC 上的时间比例 VM：JVM 的提供者，大版本号，小版本号，图中的意思是 Apple 提供的 JDK 6U51
76520发布于 2020-08-19
来自专栏北京马哥教育
Traceroute网络排障实用指南（1）
5 cr2.wswdc.ip.att.net (12.122.3.38) [MPLS: Label 17221 Exp 0] 8ms 8ms 8ms6 tbr2.wswdc.ip.att.net (12.122.16.102
3K40发布于 2018-05-02
来自专栏颇忒脱的技术博客
Flannel VXLAN 通信异常问题排障记录
rancher 所在 k8s 集群（local 集群）间歇性挂，而其纳管的另一个生产 k8s 集群没有这个问题。
99220编辑于 2022-11-21

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

Kubernetes排障指南

POD异常排障

云上如何玩转IPV6排障工具？

kubernetes 基础集群排障

跨越前后端排障鸿沟，精准排障，让IT人员不“撕逼”

Kubernetes 排障实战：用 Prometheus 提升集群可用性和排障效率

网站排障分析命令

IPv6排障工具之ping6完整过程细节剖析

Redis延迟问题全面排障指南

腾讯云Window日常排障参考

排障不翻车 | 网络工程师必收藏的排障命令大全。附下载！

kubernetes中基础服务排障记

建设大模型训练排障平台：

Kublet PLEG不健康问题排障

玩转CVM之Cloud-Init排障

网络中出现故障该如何排障？具体排除流程有哪些？【网络排障连载01】

Redis实战：延迟问题排障指南

Tomcat__05_JVM_排障工具

Traceroute网络排障实用指南（1）

Flannel VXLAN 通信异常问题排障记录

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐