首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >腾讯云可观测平台助力阿维塔构建主动式运维防御体系

腾讯云可观测平台助力阿维塔构建主动式运维防御体系

原创
作者头像
IT资讯研究所
发布2026-04-16 00:00:12
发布2026-04-16 00:00:12
1270
举报

直面可观测三重挑战

阿维塔作为车企,在数字化转型中面临可观测体系与业务发展的核心冲突。

  • 业务复杂度激增:车云系统架构模块众多、调用链冗长(覆盖车载终端至云端AI计算全链条),业务迭代迅猛致运维适应性承压,瓶颈定位难(单点故障易传导放大影响用户体验),运维效率受海量告警与复杂问题冲击。
  • 混合云治理困难:全球布局下数据孤岛林立,多云/IDC资源异构致统一纳管难,运维动线冗长(跨多平台完成根因定位),资源利用率不透明(成本浪费与性能瓶颈并存),自建监控扩展性差(存储计算易成瓶颈)。
  • 智能时代新挑战:数据未贯通(多源数据未融合、全链路追踪缺失)致智能分析无本之木;缺乏AI引擎陷“被动救火”循环(告警降噪、根因定位效能低);LLM应用等新场景难监控(调用链、Token成本与延迟透视缺失)。

部署全栈智能可观测方案

腾讯云可观测平台为阿维塔提供“资源-应用-体验”全栈监控与AI驱动解决方案。

  • 全栈资源监控与端到端链路追踪:纵向覆盖资源层(跨云全栈统一纳管计算/存储/网络/数据库等)、应用层(Java/Golang/Node.js等应用故障定位与性能剖析)、体验层(全球拨测网络模拟用户访问,监控终端体验、CDN/EO性能);横向打通端到端调用链,消除数据孤岛。
  • 智能化分析能力
    • AI异常检测:自动识别系统异常,变被动告警为主动预警(数据来源:阿维塔运维总监孙旸在腾讯全球数字生态大会分享)。
    • 智能告警治理:优化指标体系与策略,如修改内存使用率阈值从8.01调整为8.5(表达式:(1-node_memory_MemAvailable_bytes/node_memory_MemTotal_bytes) > 8.5),CPU使用率阈值从8.01调整为8.7,淘汰测试规则(如CVM High CPU Usage阈值>0的无效规则),治理告警风暴(例:某CMT(High CPU Usage)规则5秒内触发20条告警,24小时累计1652条,经优化后减少无效干扰)。
    • 智能根因分析:关联调用链、日志、指标多维度数据,AI自动推荐故障根因(数据来源:腾讯云可观测平台功能说明)。
  • 开放生态协同:通过“知识双飞轮”支持企业个性化知识上传(赋能智能体场景化经验),“MCP协同”允许自定义MCP与平台集成,打造适配阿维塔的智能体。

期待与腾讯云携手,共同构建更智能、更高效、更可靠的未来出行生态 —— 孙旸,阿维塔运维总监

量化运维效能提升成果

方案落地后实现可观测能力从“被动响应”向“主动防御”转型。

  • 告警治理显效:解决Prometheus实例告警覆盖不全(补充数据库连接性能、网络连接状态等关键指标告警)与策略配置不合理问题,告警有效性提升(数据来源:阿维塔告警治理实践案例)。
  • 核心指标优化平均故障修复时间显著缩短系统可用性提升保障业务连续,运维成本降低源于资源利用率优化(数据来源:阿维塔实施效果总结)。
  • 未来场景拓展:规划SRE数字分身(基于大模型提供7×24小时智能分析)、应用安全扫描(代码到运行时全生命周期监控)、LLM应用监控(保障模型质量与响应性能)(数据来源:阿维塔未来合作展望)。

选择腾讯云的核心价值

  • 全栈统一纳管:跨云/IDC异构资源统一监控,消除数据孤岛,提供全局运维视图(数据来源:腾讯云可观测平台架构设计)。
  • AI驱动主动运维:智能异常检测、根因分析、告警治理形成闭环,变“被动救火”为“主动防御”(数据来源:平台AI功能实测效果)。
  • 开放生态适配:知识双飞轮与MCP协同支持企业个性化需求,智能体与企业场景深度绑定(数据来源:腾讯云开放生态白皮书)。
  • 可扩展可靠性:支撑业务迭代与流量高峰,监控系统自身具备高可用性(避免自建监控存储计算瓶颈)(数据来源:阿维塔混合云治理挑战反思)。

(数据来源:阿维塔运维总监孙旸在腾讯全球数字生态大会分享内容及腾讯云可观测平台官方资料)

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 直面可观测三重挑战
  • 部署全栈智能可观测方案
  • 量化运维效能提升成果
  • 选择腾讯云的核心价值
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档