搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏Elastic Stack专栏
Elastic的CICD全观测解决方案
CI/CD 可观测性架构使用 APM 服务器，将所有 OpenTelemetry 原生 CI/CD 观测工具直接连接到 Elastic Observability。 [CI/CD可观测性架构] 使用 Elastic 构建 CI/CD 可观测性的架构更高级的 CI/CD 可观测性架构包括部署在边缘（靠近 CI/CD 工具）的 OpenTelemetry 收集器。除了 Elastic Observability 之外，还能够将可观测性信号路由到多个后端。 [在这里插入图片描述] 使用 Elastic 实现 CI/CD 可观测性的高级架构 CI/CD 管理员的可观测性 Elastic Observability 允许 CI/CD 管理员监控 CI/CD 平台并对其进行故障排除并检测异常情况将日志存储在可观测性后端有几个好处，包括：将所有的可观测性数据进行统一的存储，更利于我们实现Jenkins实例的全观测性、监控、警报和故障排除。
7.2K361编辑于 2022-04-07
来自专栏AIOps
探秘全栈可观测五层架构，嘉为蓝鲸全栈智能观测中心助力运维进阶
嘉为蓝鲸全栈智能观测中心·鲸眼（以下简称“全栈智能观测中心”）作为腾讯大规模IT生产环境锤炼出的全栈智能观测中心，凭借一体化融合设计、开箱即用的信创生态支持、云原生监控能力以及本土化服务优势，正成为企业替代 3）全栈智能观测中心与Tivoli的监控能力替换以下将通过具体场景对比，进一步阐述全栈智能观测中心的核心价值与落地实践。全栈智能观测中心旨在提供一个更现代化、更统一、更能开箱即用的全栈可观测平台，在大部分的监控场景中，全栈智能观测中心一个产品就能实现Tivoli三个子产品的效用：1）基础架构与组件监控全栈智能观测中心提供开箱即用的监控能力 03.全栈智能观测中心替换 Tivoli 事件规则实操截至目前，全栈智能观测中心团队已经在近十个项目中将 IBM Tivoli 替换为全栈智能观测中心产品，一个核心且常见的需求是将Tivoli系统中长期积累的事件规则迁移至全栈智能观测中心平台 04.更多全栈可观测能力全栈智能观测中心作为嘉为蓝鲸倾力打造的一款全栈可观测产品，经过持续的沉淀和迭代，目前已经实现了业务全栈系统资源监控、K8s容器监控、云平台监控、硬件设备监控、网站服务拨测、日志统一管理
67310编辑于 2025-04-14
来自专栏FunTester
Java应用全链路追踪可观测性实践
追踪和可观测性已成为实现这些目标的关键实践。本文探讨了Java应用程序中的追踪概念，深入研究了代码插桩技术，并展示了它们如何促进全栈可观测性。理解追踪和可观测性追踪涉及记录应用程序中请求或事务的流程。它捕获关于操作执行的详细信息，包括时间、持续时间和上下文。在分布式系统中，追踪有助于可视化请求如何在多个服务和组件之间传播。可观测性是指通过系统的外部输出来推断其内部状态的能力，主要由日志、指标和追踪三大支柱构成：日志用于记录离散事件，指标反映随时间变化的数值数据，追踪则展现请求在系统中的路径。 Java中的插桩技术插桩是向代码中添加观测能力的过程。在Java中，可以使用几种技术来实现：手动插桩开发者明确添加代码来记录追踪数据。实现全栈可观测性全栈可观测性意味着跨前端、后端、数据库和外部服务的可见性。集成追踪、日志和指标结合所有三大支柱以获得全面的洞察。
33010编辑于 2026-01-05
来自专栏瓜农老梁
FA6# 全链路观测平台设计点归纳
引言全链路观测平台设计离不开基础数据的采集、提炼和呈现。本文就基础数据日志、指标、链路的采集原理进行梳理，如何将其关联最终提供辅助决策价值提点归纳。，提高决策能力 3.分析能力沉淀问题分析的最佳实践库，将其自动化分析提升定位能力 4.自愈能力基于分析能力，沉淀自愈策略自愈策略的灵活配置 5.性能与稳定性采集延迟、计算能力、查询性能可视化观测平台自身的稳定性建设 6.可视化能力可观测一站式丰富图表与报表 7.预测能力基于历史数据沉淀算法模型预测未来可能发生的问题
80131编辑于 2022-01-04
来自专栏云原生应用工坊
IT咖啡馆｜全栈可观测数据库设计
IT咖啡馆｜全栈可观测数据库设计线 I/O 面交给 OpenObserve（OO），治理/知识面沉到 PostgreSQL 栈（Timescale + AGE + pgvector）。摘要本文落地一套「全栈可观测」数据库设计：明细进 OO，PG 仅存 12 张核心表（维度、定位符、指标 1m、服务调用 5m、日志指纹/计数、拓扑时态、知识库、事件/证据），并用 AGE 维护“当前服务级调用图 d.resource_id = t.dst_resource_idWHERE t.tenant_id = $tenant AND t.valid @> $timestamp::timestamptz;与「全塞
37910编辑于 2025-08-29
腾讯云可观测平台：全栈智能观测驱动运维效率与系统稳定性提升
提供全栈观测方案腾讯云推出腾讯云可观测平台（Tencent Cloud Observability Platform, TCOP），集指标、链路、日志于一体，提供一体化智能监控解决方案。核心模块包括：一体化观测：整合H5/Web/小程序、微服务、Kubernetes、200+云产品等数据源，通过DSL关联分析、统一存储、实时异常检测实现全栈数据打通（数据来源：TCOP全景图）。选择腾讯云的核心优势技术领先性：一体化观测实现全链路横向关联与全栈资源纵向穿透，支持端到端统一监控（数据来源：“总览全局”章节）； Prometheus监控服务解决开源版水平扩展痛点，数据存储无上限权威认证：腾讯云可观测平台获评信通院《云计算系统智能化可观测性能力成熟度模型》认证最高级-智能引领级（Lv5）（数据来源：“行业认证”章节）；云压测获信通院首届“云系统稳定安全运行优秀案例” （数据来源：腾讯云可观测平台介绍手册及相关产品章节）
26510编辑于 2026-04-16
DeepFlow 全栈可观测性护航某银行核心系统全生命周期
DeepFlow全栈可观测性实践案例DeepFlow的全栈可观测性产品能力主要体现在四个方面：云上云下业务全景图：观测每个服务的性能全栈调用链追踪：观测每个调用的性能持续性能剖析：观测每个函数的性能OneAgent 下面以某行客户为例子，分享各个团队使用DeepFlow全栈观测平台的实践案例。开发测试团队开发测试团队对可观测性能力的依赖主要体现在两个阶段功能测试：追踪、日志、剖析是高效调测分布式应用的必备能力，在开发阶段可通过插桩获取这些能力，全栈观测平台的零侵扰可观测性能让这些能力的获取更为简单通过全栈观测平台调用日志观测数据，分钟级在几百个Pod中定位出异常Pod，最终定位调大MaxMetaspaceSize以及MetaspaceSize解决。 02｜Agent的自我持续剖析能力DeepFlow全栈观测平台的业务全景拓扑、全栈链路追踪、持续性能剖析对自身也同样适用。
90410编辑于 2025-11-26
腾讯蓝鲸游戏服务全链路、真全栈无盲点可观测实践
01 序言本文整理自2023年12月16日于北京清华大学举办的以《网络为中心的零侵扰可观测性》的技术论坛，来自蓝鲸观测平台团队的刘文平做了题为《腾讯游戏真全栈观测实践》的演讲。介绍了腾讯 IEG 蓝鲸观测平台如何运用前沿的 DeepFlow 的 eBPF 技术，结合传统的 APM 体系，实现了对游戏服务全链路、真全栈，无盲点观测。演讲围绕腾讯游戏的真全栈观测实践，介绍了蓝鲸观测平台的功能、架构、以及与 OTel 和 eBPF 技术的结合使用。到这里的话，基本上上面的能力，已经能满足我们想要的全观测能力。下面我再以游戏的全栈观测场景，来展示下我们是怎么去实践的。可以看到上面，我们通过以trace为中心的数据全关联的形式，对于玩家反馈的问题，让开发者可以在这个视角下做到数据的全观测。
1.4K10编辑于 2024-02-06
来自专栏Apache Doris
全表扫描？ AI Agent 动态 JSON 的观测分析
像 LangSmith、Langfuse 这样的现代观测平台，已经将 Agent Trace 定义为一棵包含完整上下文的执行树。这意味着：Agent 观测的核心目标，已经从“记录结果”转变为“还原过程”。面对这种高度复杂的执行语义，传统只适合聚合统计的扁平日志模型，显然已经无法适用。表面上这只是一次很常见的观测分析，但由于这些字段都藏在 String 里，查询引擎的优化器对此一无所知。结果就是：真正符合条件的目标数据可能仅占 0.1%，但系统却迫做了一次全表扫描（Full Scan）。面对 TB 级别的长文本，传统的 LIKE 会导致全表扫描。
19310编辑于 2026-05-13
来自专栏深度学习与python
作业帮基础观测能力之二全链路追踪实践
此时，传统的追踪系统已无法满足对多服务、跨系统的全链路追踪需求，因此需要引入分布式追踪系统。成本优势：能够以较小的机器预算支撑起全公司大规模追踪数据的处理与存储落地，且性能表现良好。基于服务的追踪（Service-Based Tracing）以上的两类采集方式专注于对服务边界的观测, 如果服务有对内部的观测需求则通过服务自定义打点的方式上报追踪数据，按需增加追踪深度。，始终围绕着“降低使用门槛、赋能业务决策”两大核心目标，让每一次请求可观测、可诊断、可优化。然而，在拥有全量追踪数据后，我们就可以实时消费这些数据，并对其进行聚合统计，从而支持从服务和链路的视角来分析请求链路的整体状态。
40720编辑于 2025-06-08
来自专栏云原生应用工坊
IT咖啡馆｜全栈可观测数据库 ETL 设计
T10 — 观测指标与窗口滞后描述：导出 Prometheus 指标（自定义 /metrics 或写回 OO）；记录窗口滞后。
36610编辑于 2025-09-02
来自专栏架构驿站
一文搞懂基于 OpenTelemetry 进行 Kubernetes 全链路观测
---- Hello folks，我是 Luga，今天我们来聊一下云原生生态核心技术—— 可观测性，即 “基于 OpenTelemetry 进行 Kubernetes 全链路观测” 。在这样的动态 Kubernetes 环境中，观测资源对于确保平台上运行的应用程序的健康至关重要。然而，动态的 Kubernetes 环境给观测带来了很大的复杂性。面对这些挑战，组织需要采用更先进的观测方法和工具，如 OpenTelemetry，以应对 Kubernetes 环境的复杂性和动态性，提供更全面和准确的观测能力。因此，使用 OpenTelemetry 可以帮助组织克服传统观测方法的局限性，提供更全面、细粒度的观测能力，从而提高对分布式应用程序的理解和故障诊断能力。 — 03 — 揭秘 OpenTelemetry 在观测 Kubernetes 中的关键作用尽管有多种方法可以对 Kubernetes 进行观测，但与传统的观测选项相比，使用 OpenTelemetry
4.8K64编辑于 2023-09-25
来自专栏重归混沌
谈谈观测
随着这几年我对 eBPF、Prometheus 等工具的深入了解，我才逐渐意识到“可观测性”这个词背后蕴含的意义。很早以前，我就在 Linux 上使用 /proc/、top、sar 等工具来排查问题，却从未意识到，“观测”竟然是一门独立的学问。这也正是“可观测性”弥足珍贵的原因之一：当系统出问题时，我们可以通过系统本身提供的可观测能力，去追踪和理解到底发生了什么。不得不佩服 Linux 的设计者们，/proc 文件系统的设计在多年以前就已体现出极强的可观测性理念。我并不想讲怎么样实现可观测性，毕竟我不是专家。但我想谈谈观测给了我们一个什么样的视角。也就是说，在调用 foo 前后各执行一次全量 GC，程序的内存使用应该没有任何变化。
11010编辑于 2026-03-25
来自专栏初代庄主
观测 CPU
背景通常在分析性能问题时，我们会用 `top , sar , perf` 来观测 CPU 的使用情况；多数据情况下是观测别人的程序。如果从熟悉工具的角度来看，观测自己的程序，根据观测到的结果再结合程序源代码，对于我们掌握性能分析工具会更有帮助。 for(;;) { // 不断的查询父进程的 pid ，这个会占用 sys 空间 getppid(); } } ---- sar 看 cpu 的使用率要观测所有
59940编辑于 2022-05-17
企业网络监控的演变与全栈可观测性趋势
六、全栈统一监控的实践价值由于多数企业同时运行网络、服务器、应用和安全工具，数据割裂问题突出。随着企业IT环境持续复杂化，具备全栈覆盖能力、开放集成和预测分析能力的监控平台，正成为保障业务连续性的重要工具。运维团队可结合自身现状，逐步引入相应的能力，提升故障预防与处置效率。
11310编辑于 2026-06-30
来自专栏云原生应用工坊
IT咖啡馆｜漫谈监控简史到全栈可观测数据选型
全栈可观测，先画边界 “全栈”不只是炫酷口号，真正落地要回答三件事：信号面要齐全：Metrics / Logs / Traces / Flows / Profiling / RUM / 业务指标，一个都不能漏语义面要统一：所有观测数据都需要“事件包络”+“拓扑图谱”，才能相互验证、形成证据链。全栈不是把所有数据丢进一个大桶，而是职责分层，让信息能互证。 3. 误区一：可观测 ≠ 替代监控监控和可观测职责不同，缺一不可：监控：早发现，负责“红灯要亮”，比如 SLO 守门、阈值触发、自动回滚。 7.主流选型并排评审要做全栈可观测，免不了要面对几个“老熟人”方案。不同技术各有来历和优势，有的天生为可观测而生，有的则是“借道而入”。 2) 性能与可观测体验 OO 处理时间窗 + 标签的典型检索：TOPK、错误率、分位数，近线秒级。 Timescale 连续聚合命中，历史报表/趋势避免全表扫。
59910编辑于 2025-08-27
来自专栏深度学习与python
作业帮服务观测之基础观测能力
因此，你可以得到两全其美的结果。假如你要为自己的律师事务所构建一个聊天机器人。
26810编辑于 2025-06-08
来自专栏AIOps
可观测告警全生命周期管理：从风暴抑制到智能闭环
直达原文：可观测告警全生命周期管理：从风暴抑制到智能闭环01.引言在分布式架构与云原生技术普及的今天，可观测性已成为企业运维的核心能力。嘉为蓝鲸告警中心作为可观测体系的关键中枢，通过告警接入、丰富、收敛、分派、分析、处置六环节的自动化闭环设计，将告警数据转化为可行动的运维洞察，助力企业实现从被动响应到智能治理的跨越。 02.结语：从治理到智能的跨越嘉为蓝鲸告警中心通过 “告警精准捕获-集中接入-快速丰富-高效抑制-定向派单-闭环处置” 的全生命周期管理，已助力某大型机场实现告警覆盖率90%、收敛率75%，某证券公司在日均百万级告警下仍保持其核心价值在于将 “被动响应”转化为“主动治理” ，以自动化与智能化重塑运维可观测效率标杆。
47510编辑于 2025-06-09
2025企业可观测产品选型实战指南：可观测是什么？可观测平台怎么选？
01.可观测是什么？核心价值在哪里？1）可观测的定义可观测性是通过采集IT系统全链路数据（指标、日志、调用链、拓扑），结合智能分析技术，实现从业务异常到根因定位的全流程可视、可分析、可追溯的能力。 02.3款可观测平台对比1）嘉为蓝鲸全栈智能可观测中心核心定位面向中大型企业的全栈智能可观测平台，以“指标、日志、调用链、拓扑”全链路数据融合为基础，“业务可观测”为核心，“AI智能闭环”为驱动，覆盖从底层硬件到上层业务的全链路观测 2）腾讯云可观测平台（TCOP）核心定位腾讯云原生一体化可观测平台，深度绑定腾讯云生态，聚焦云原生全链路观测场景，主打“云资源联动+轻量化部署”。 2）按核心需求优先级选型业务可观测+智能闭环：嘉为蓝鲸（业务关联深、AI能力全）；云原生全链路观测：腾讯云TCOP（开源生态兼容、轻量化部署）；网络性能精准监控：SolarWindsNPM（多厂商设备适配，既保留网络专项监控的精准性，又实现全栈数据的统一观测，避免数据孤岛。
39310编辑于 2025-11-19
来自专栏运维有术
3 大体系 × 3 层指标：Milvus 全链路可观测监控搭建指南
Alloy 是 Grafana 生态中的新一代可观测性收集器，基于 OpenTelemetry Collector 构建，可以同时处理 metrics、logs、traces 三类信号。确保查询时至少包含一个标签（如 {namespace="default"}），避免全量扫描。日志量大时建议启用 Loki 的 chunk cache 和写入去重。三个体系搭建完成后，你的 Milvus 就从裸奔状态变成了全面可观测。建议收藏这篇教程，下次搭建监控环境时直接翻出来跟着做。
29010编辑于 2026-04-29

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

Elastic的CICD全观测解决方案

探秘全栈可观测五层架构，嘉为蓝鲸全栈智能观测中心助力运维进阶

Java应用全链路追踪可观测性实践

FA6# 全链路观测平台设计点归纳

IT咖啡馆｜全栈可观测数据库设计

腾讯云可观测平台：全栈智能观测驱动运维效率与系统稳定性提升

DeepFlow 全栈可观测性护航某银行核心系统全生命周期

腾讯蓝鲸游戏服务全链路、真全栈无盲点可观测实践

全表扫描？ AI Agent 动态 JSON 的观测分析

作业帮基础观测能力之二全链路追踪实践

IT咖啡馆｜全栈可观测数据库 ETL 设计

一文搞懂基于 OpenTelemetry 进行 Kubernetes 全链路观测

谈谈观测

观测 CPU

企业网络监控的演变与全栈可观测性趋势

IT咖啡馆｜漫谈监控简史到全栈可观测数据选型

作业帮服务观测之基础观测能力

可观测告警全生命周期管理：从风暴抑制到智能闭环

2025企业可观测产品选型实战指南：可观测是什么？可观测平台怎么选？

3 大体系 × 3 层指标：Milvus 全链路可观测监控搭建指南

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

Elastic的CICD全观测解决方案

探秘全栈可观测五层架构，嘉为蓝鲸全栈智能观测中心助力运维进阶

Java应用全链路追踪可观测性实践

FA6# 全链路观测平台设计点归纳

IT咖啡馆｜全栈可观测数据库设计

腾讯云可观测平台：全栈智能观测驱动运维效率与系统稳定性提升

DeepFlow 全栈可观测性 护航某银行核心系统全生命周期

腾讯蓝鲸 游戏服务全链路、真全栈无盲点可观测实践

全表扫描？ AI Agent 动态 JSON 的观测分析

作业帮基础观测能力之二全链路追踪实践

IT咖啡馆｜全栈可观测数据库 ETL 设计

一文搞懂基于 OpenTelemetry 进行 Kubernetes 全链路观测

谈谈观测

观测 CPU

企业网络监控的演变与全栈可观测性趋势

IT咖啡馆｜漫谈监控简史到全栈可观测数据选型

作业帮服务观测之基础观测能力

可观测告警全生命周期管理：从风暴抑制到智能闭环

2025企业可观测产品选型实战指南：可观测是什么？可观测平台怎么选？

3 大体系 × 3 层指标：Milvus 全链路可观测监控搭建指南

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

DeepFlow 全栈可观测性护航某银行核心系统全生命周期

腾讯蓝鲸游戏服务全链路、真全栈无盲点可观测实践