📌 故障处理 9 步法:
1. 接收告警或用户报告(主动监控 / 被动感知)
2. 初步确认:复现问题、锁定受影响范围
3. 收集信息:拓扑、配置、日志、流量、链路状态等
4. 层次定位:结合OSI模型 + 对比分析
5. 工具诊断:ping, tracert, display, debug, Wireshark, Netflow, NQA等
6. 原因分析与验证:结合日志与业务操作匹配
7. 快速恢复:隔离问题、切换备链或替代路径
8. 根因确认与修复:配置修改、硬件替换、策略优化
9. 故障复盘:更新运维文档,提升防御手段方法 | 描述与应用场景 |
|---|---|
分层法 | 基于OSI模型,逐层验证每个网络层是否出现异常 |
对比法 | 将故障设备与正常设备的配置/接口状态进行对比,快速发现差异 |
逐步替换法 | 替换网线、模块、设备、配置等,验证是否为物理或软故障 |
分段法 | 拆解网络结构,如:接入 → 汇聚 → 核心 → 出口,分别进行链路测试 |
回滚法 | 快速恢复关键配置状态,如启动备份配置、启用静态路由等应急策略 |
工具辅助 | 利用抓包工具(如Wireshark)、流量监控(Netstream)、链路检测(NQA/BFD)精准定位故障点 |
时间线分析法 | 将配置变更、业务变动、用户反馈、日志时间线对比,找出因果关系 |
场景 | 故障表现 | 常见原因与建议 |
|---|---|---|
SDN控制器失联 | 南北向流量中断 | 控制器主备配置异常、OpenFlow连接断链、心跳不通 |
IPv6主机无法访问公网 | 可访问内网但无法上网 | 缺省路由未配置、RA广播丢失、NAT64转换缺失 |
云服务器私网失联 | Ping通但业务不通 | 云安全组限制、Overlay网络异常、VPC跨区域中断 |
MPLS VPN互访异常 | 用户A无法访问用户B | VPN实例未绑定接口、标签学习失败、PE未发布BGP-VPNv4路由 |
VRRP主备切换异常 | 主设备离线但备设备未接管 | VRRP优先级低/未同步、心跳接口未UP、链路双DOWN但未触发抢占 |
DHCP分配异常 | 客户端自动IP获取失败 | 中继未配置、ACL拦截、地址池枯竭 |
工具/命令 | 用途说明 |
|---|---|
| 查看设备基本信息(型号、状态) |
| 查看接口up/down状态与IP/MAC |
| 查看路由学习情况及优先级 |
| 检查ACL过滤是否阻断流量 |
| 查看是否学习到MAC、是否转发异常 |
| 检查路由协议邻居是否建立、状态变化 |
| 查看最近设备日志(硬件/协议故障/认证问题) |
| 带源地址、多包、多次ping测试网络连通性 |
| 主动探测链路状态(质量、丢包、延迟) |
Wireshark抓包 | 分析ARP请求、TCP三次握手、DNS解析、认证失败等关键数据包 |
Netstream/telemetry | 流量流向分析,定位异常流量源 |
答:
答:
答:
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。