首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 蓝鲸观测平台:统一观测数据关联模型探索

    前 言本文为蓝鲸观测平台数据模块负责人 在 蓝鲸智云 和 DeepFlow 社区 合办的第六场 eBPF 零侵扰可观测性 Meetup 上的演讲,原来题为根因定位关键:统一观测数据关联模型探索概 述根因分析高度依赖关联的观测数据 在横向,PaaS 像有一些 AIops 平台、容器平台、作业平台、集成管理、CI/CD 等等,在整个PaaS 层面进行数据可以打通。 第二部分就是我们蓝鲸观测平台已经做了好几年了,在这几年的过程中,我们基于整个观测场景搭建了那么一套观测体系,有常见的三大支柱,我们现在加了一根第四根支柱,就是事件那块,像指标、Logs、Trace 等等 整个体系的各个组件均具备插拔性,整体以蓝鲸企业版的形式开源对外。 转型困境在向可观测性转型的过程中,我们面临以下困境:数据孤岛:不同工具和平台产生的数据难以关联,形成孤立的信息源。

    89110编辑于 2024-09-27
  • 来自专栏后端技术

    串行化 数据库恢复 观测序列化

    串行化 冲突串行化是串行化的充分条件 CLR Compensation Log Record 数据库恢复 分析阶段 graph TD A(把事务加入事务表)-->C(把已结束的事务剔除出事务表) 观测序列化 很好的参考文章

    90640发布于 2019-05-25
  • 2025企业可观测产品选型实战指南:可观测是什么?可观测平台怎么选?

    选择一款适配自身架构的可观测平台,成为企业保障业务连续性、降低运维成本的关键。本文先厘清可观测的核心定义与价值,再通过3款可观测平台的深度对比,结合实战选型逻辑,助力企业精准落地可观测能力。 2)腾讯云可观测平台(TCOP)核心定位腾讯云原生一体化可观测平台,深度绑定腾讯云生态,聚焦云原生全链路观测场景,主打“云资源联动+轻量化部署”。 03.可观测平台怎么选? 中小企业优先解决核心痛点:若为腾讯云用户,可选腾讯云TCOP(SaaS模式,按用量付费);若需基础全栈观测,可先用开源工具搭建基础能力,再逐步升级至嘉为蓝鲸等企业级平台。 A:嘉为蓝鲸的核心优势集中在“复杂架构适配+业务深度关联+国产化合规”:混合架构场景:同时兼容国产软硬件与多云环境,腾讯云TCOP聚焦腾讯云生态;业务可观测场景:嘉为蓝鲸可直接关联业务交易与IT故障,

    25710编辑于 2025-11-19
  • 来自专栏测试面试题

    观测平台解决什么问题

    观测平台通过统一数据收集和处理,帮助团队了解系统当前的运行状态,快速预防、发现、定位并解决业务问题,提升业务效能。 可观测平台通过日志、指标、链路等机器数据进行关联分析,帮助团队快速定位问题和风险,确保系统的稳定运行。 提升业务效能:可观测平台通过提供更好的业务运行的能见度,帮助团队更好地解决问题,优化业务流程,提高业务效能。 组织协作:可观测性数据平台作为不同层级进行协作的桥梁,使技术同学以及架构的同学在同个数据池进行沟通时有共同的参考,从而提升整个组织的协作效率。 资源管理和优化:通过监测资源利用率、成本分析等数据,可观测平台帮助管理员对资源进行合理调配,避免资源浪费和不必要的成本开销。

    32910编辑于 2024-10-15
  • 来自专栏云原生应用工坊

    观测平台-1:技术选型分析

    观测平台 是面向应用的可观测平台,不仅可以监控指标数据,还可以监控日志数据和链路追踪数据。它们通常使用 TSDB、NoSQL 或图数据库来存储指标数据、日志数据和链路追踪数据。 构建一个开源的可观测平台 将不同的软件组合在一起,根据实际的需要,构建一个满足特定需求的可观测平台。 例如,可以将 Prometheus、Grafana 和 AlertManager 组合在一起,构建一个基本的可观测平台。 也可以将 Prometheus、Grafana、AlertManager 和 DeepFlow 组合在一起,构建一个功能更强大的可观测平台 开源可观测平台软件选型组合主要包括以下几个方面: 数据存储:ClickHouse 参考 开源可观测平台解决方案 https://cloud.tencent.com/developer/article/2363793 开源可观测平台解决方案-运维手册 https://cloud.tencent.com

    1.5K10编辑于 2023-12-13
  • 来自专栏云云众生s

    现代可观测平台的架构

    现代可观测平台的架构,数字艺术 可观测平台是一个端到端的系统,帮助组织了解其应用程序和服务的健康状况。 在规模上收集、摄取、存储和查询可观测性数据是现代可观测平台的设计目标。根据底层架构的不同,运行这些平台的成本可能相差 100 倍以上。本文介绍了实施不同类型架构的不同解决方案。 目前所有的可观测性供应商都支持 OTEL 。 统一存储 随着可观测性数据越来越庞大,人们开始意识到使用高性能数据库来存储和索引所有这些数据的方法并不具备扩展性。 这一切都有代价——主要驱动因素是可观测平台的底层架构(以及供应商希望实现的利润)。 通过统一存储层,可观测平台能够在规模上实现扩展,同时将成本降低一个数量级。 现在有机会通过统一可观测性管道的每个层面来创建一个更具规模和负担性的可观测平台。在之前的文章中,我们展示了对比 Datadog ,通过将日志统一处理可以将成本降低 95% 以上。

    61720编辑于 2024-03-27
  • 来自专栏云原生应用工坊

    观测平台-4: 告警配置参考

    这个开源的可观察性平台解决方案通过GitHub Actions自动交付,以创建服务。 可观察性平台操作 在完成平台安装和部署后(有关详细信息,请参阅先前的文章:https://cloud.tencent.com/developer/article/2363793),登录到控制台。

    1.2K10编辑于 2023-12-14
  • 来自专栏云原生应用工坊

    观测平台-3: 应用系统监控项

    在讨论以容器应用为视角的监控和告警时,有几个关键点需要注意。首先,传统的基于主机资源的监控方法(如使用率和负载监控)可能不再适用于动态、多副本的Pod环境。这是因为在容器化和微服务架构中,应用服务的动态性和弹性更加突出。

    65720编辑于 2023-12-13
  • 来自专栏腾讯云可观测专栏

    腾讯云可观测平台产品月报

    ---- 欢迎关注腾讯云监控,了解最新动态 👇点击阅读原文查看更多、更详细的产品动态

    2.3K20编辑于 2023-04-11
  • 来自专栏有文化的技术人

    如何构建无侵入的可观测平台

    使用opentelemetry开源标准协议实现: 搭建trace、metric、log三种观测信号的服务端 通过opentelemetry提供的SDK库封装业务侧操作 通过切面编程的方式获取业务服务相关信息

    26810编辑于 2024-02-27
  • 来自专栏k8s技术圈

    云原生可观测平台 OpenObserve 初体验

    OpenObserve 是一个 Rust 开发的开源的高性能云原生可观测平台(日志、指标、追踪),比起 Elasticsearch 它大约可以节省 140 倍的存储成本,OpenObserve 能够处理 PB 级的数据,如果你正在寻找一个用于日志、指标、追踪的可观测工具,那么 OpenObserve 是非常值得尝试的。 与 Elasticsearch 相比,Elasticsearch 是一个通用性的搜索引擎,同时也兼具观测工具的功能。 而 OpenObserve 是从头开始构建的观测工具,非常注重提供优秀的可观测性能。 架构 OpenObserve 可以在单节点下运行,也可以在集群中以 HA 模式运行。

    3.8K50编辑于 2023-08-21
  • 来自专栏云原生应用工坊

    观测平台-3.3: 数据库监控项

    开源数据库系统可以分为关系型数据库(如 MySQL, PostgreSQL)和 NoSQL 数据库。下面列举了一些常见的开源数据库和相应的监控配置。

    38410编辑于 2023-12-13
  • 腾讯云可观测平台:全栈智能观测驱动运维效率与业务稳定

    提供一体化智能观测解决方案 腾讯云可观测平台(Tencent Cloud Observability Platform, TCOP)集成指标、链路、日志于一体,提供全栈智能观测方案,核心组件包括: AI工作台:实现可观测全栈数据智能化打通,含知识双飞轮体系、7×24小时智能SRE数字分身,支持主动防御与智能运维(数据来源:腾讯云可观测平台介绍手册)。 量化应用效果与客户价值 方案落地后实现量化业务价值,关键指标如下(数据来源:腾讯云可观测平台介绍手册): 运维成本显著降低:云压测资源按需分配“随用随建”,节约测试成本;Grafana托管免运维“ 权威认证与奖项: 获信通院《云计算系统智能化可观测性能力成熟度模型》认证最高级-智能引领级(Lv5)(数据来源:腾讯云可观测平台介绍手册)。 云压测(PTS)获信通院首届“云系统稳定安全运行优秀案例”(数据来源:腾讯云可观测平台介绍手册)。

    9610编辑于 2026-04-13
  • 腾讯云可观测平台:全栈智能观测驱动运维效率与业务稳定

    构建一体化智能观测技术体系 腾讯云可观测平台(Tencent Cloud Observability Platform, TCOP)提供集指标、链路、日志于一体的全栈智能观测解决方案,核心产品与能力包括 量化应用效果与客户价值 平台核心价值通过以下数据体现(数据来源:腾讯云可观测平台介绍材料): 数据处理能力:每日支持4000亿数据上报量,支持上百亿页面PV统计。 接入效率:前端性能监控一行代码无侵入接入,终端性能监控Pro支持多平台符号表自动解析与自定义日志采集。 Why Tencent:技术领先性与权威认证 腾讯云可观测平台的技术优势与认可包括: 技术领先性:全栈数据智能化打通(指标/链路/日志/事件)、知识双飞轮体系驱动主动运维、多产品深度融合(TKE/Prometheus 腾讯云可观测平台获评信通院《云计算系统智能化可观测性能力成熟度模型》认证最高级-智能引领级(Lv5)(数据来源:材料“腾讯云可观测平台获评信通院《云计算系统智能化可观测性能力成熟度模型》认证最高级-智能引领级

    9000编辑于 2026-04-14
  • 来自专栏云原生应用工坊

    观测平台-4.2: CacheMQTQ 中间件告警管理

    这通常涉及到配置Redis,以将日志输出到一个文件中,然后使用类似Filebeat的工具来收集这些日志并发送到日志分析平台。 这通常涉及配置 Celery 以将任务执行信息记录到日志文件中,然后使用类似于 Filebeat 的工具来收集这些日志并发送到日志分析平台

    53210编辑于 2023-12-14
  • 来自专栏云原生应用工坊

    观测平台-4.3: 数据库告警配置参考

    要导出MySQL日志,您可以配置MySQL以记录查询、慢查询和与复制相关的信息。您可以使用Filebeat或Fluentd等工具来收集并发送这些日志进行分析。

    62810编辑于 2023-12-14
  • 来自专栏运维开发故事

    夜莺 V6 全新升级为开源观测平台

    今天我们郑重发布夜莺 6.0 beta 版本,全面支持 Metrics、Logging、Tracing,向着构建开源、开放、完整的可观测性解决方案迈进。 夜莺 V6,是夜莺监控往全栈可观测性解决方案迈进的关键一步,是夜莺项目管理委员会和夜莺开源社区共同努力的成果。 一家云原生智能运维科技公司,也是夜莺项目管理委员会的核心成员,专注于为企业提供全栈可观测性解决方案以及构建企业级的稳定性保障体系 如有需要欢迎 联系我们,做产品交流、试用产品,合作共赢:)

    85620编辑于 2023-05-01
  • 来自专栏云原生应用工坊

    观测平台-3.2: CacheMQTQ 中间件监控项

    Apache Kafka 高吞吐量、分布式的流处理平台,常用于大数据处理。 ActiveMQ 支持多种消息协议,具有灵活的配置和多种语言客户端支持。 Apache Pulsar 分布式的消息流平台,具有高吞吐量和低延迟特性。 配置监控项 监控消息队列系统是确保数据流畅传递和系统稳定性的关键。以下是通用的监控项: a. 高度可靠且扩展。 Redis Queue (RQ) 基于 Redis 的简单 Python 库,用于队列管理和处理后台任务。 易于使用和设置。 适用于小到中型项目。 Apache Kafka 分布式流处理平台,常用作消息队列。 高吞吐量,适合大数据场景。 支持多种数据源和目标系统。 Beanstalkd 轻量级的内存队列系统。 专注于快速、简单的工作队列。 高性能、可靠性和伸缩性。 JMS(Java消息服务)兼容。 Bull 基于 Redis 的 Node.js 队列系统。 强大的功能和高度定制。 支持任务优先级、定时任务和重试机制。

    89810编辑于 2023-12-13
  • 来自专栏EMQ 物联网

    易操作、可观测扩展,EMQX如何简化物联网应用开发

    配置热更新根据是否可在运行时修改,EMQX 5.0 的配置可以分成热更新/不可热更新两种配置。 热更新配置都可以通过 HTTP API 修改成功后立即生效,同时保证配置修改在集群间同步更新。 可观测性强大的日志功能日志为系统排错、优化性能提供可靠信息来源。EMQX 在日志数据过载或日志写入过慢时,默认启动过载保护机制,最大限度保证正常业务不被日志影响。 图片ExHook 基于 gPRC 通信,理论上支持任意语言平台和微服务,通过 ExHook 可以实现客户端认证、权限检查、数据存储与改写消息流程等业务的集成。 如前文提到,可操作性与可观测性的提升将使 EMQX 集群的运维工作变得更加轻松与高效,扩展性的增强则为用户定制更加符合自身需求的 EMQX 提供了便利。

    1.1K00编辑于 2022-10-10
  • 来自专栏瓜农老梁

    FA6# 全链路观测平台设计点归纳

    引言 全链路观测平台设计离不开基础数据的采集、提炼和呈现。本文就基础数据日志、指标、链路的采集原理进行梳理,如何将其关联最终提供辅助决策价值提点归纳。 ,提高决策能力 3.分析能力 沉淀问题分析的最佳实践库,将其自动化分析提升定位能力 4.自愈能力 基于分析能力,沉淀自愈策略 自愈策略的灵活配置 5.性能与稳定性 采集延迟、计算能力、查询性能 可视化观测平台自身的稳定性建设 6.可视化能力 可观测一站式 丰富图表与报表 7.预测能力 基于历史数据沉淀算法模型预测未来可能发生的问题

    75731编辑于 2022-01-04
领券