首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >问题定位,如何从 1 小时缩短到 1 分钟?

问题定位,如何从 1 小时缩短到 1 分钟?

作者头像
用户9139003
发布2025-06-09 10:58:05
发布2025-06-09 10:58:05
1730
举报
文章被收录于专栏:开发者开发者

【背景】重要活动即将启动,A公司以一个典型的异地多活架构承载直播业务。

【问题】活动刚开始,业务团队反馈客户端下载速度过慢,访问 CLB 质量有波动,出现丢包现象,影响客户线上体验。

【排障过程】

SRE团队紧急介入排查 CLB 实例,发现无异常。(1)

但随着活动流量上涨,现象恶化。继续怀疑后端 CVM 有问题,但 CVM除了一个业务应用模块 crash外无明显错误。(2)

解决业务应用问题后,直连 CVM 快了,但通过 CLB 仍然慢。网络专家排查 CLB 与 CVM 之间链路也并无问题。

前端团队再次反馈,ping CLB 仍然有明显持续丢包,于是排查转回客户端到 CLB 之间的链路问题。而客户端所在地域到 CLB 所在地域网络链路也是畅通。

【结果】最终再聚焦回 CLB,发现出流量暴涨,然而 EIP 带宽限额明显不足出流量带宽的 ¼,至此破案,升级带宽限额,修改计费模式。消除瓶颈恢复业务。(3)

【优化】云顾问核心应用可帮助及时定位甚至提前规避:

事前-云架构:一键绘制业务云架构,评估风险治理问题更容易有全局视角(图 2)

事中-容量监测: EIP 带宽利用率监测可实时发现风险,亦可进行放量预测提前摸排(图 3)

事前&事中-云护航:企业客户可在云护航内获得腾讯云重保活动支持,腾讯云为客户提供护航前评估、护航中监测、服务异常播报、主动服务告警等关键服务(图 4)

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2024/11/19 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档