首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >为什么说 Doris 是可观测性平台的理想选择?

为什么说 Doris 是可观测性平台的理想选择?

作者头像
数据极客圈
发布2025-08-08 13:27:41
发布2025-08-08 13:27:41
3940
举报

在分布式系统日益复杂的今天,可观测性已成为保障业务稳定性的核心能力。从日志(Logging)、链路追踪(Tracing)到指标(Metrics),海量观测数据的高效处理直接决定了故障排查速度、资源优化效率和业务决策精度。

作为现代化 MPP 数据仓库,Apache Doris 凭借高性能、低成本、易扩展的特性,在可观测性场景中展现出显著优势,成为替代 Elasticsearch、ClickHouse 的优选方案。今天我们就从技术底层拆解 Doris 的可观测性 “硬核实力”。

一、性能碾压:实时写入与极速查询双突破

可观测性数据的核心诉求是 “实时可见”—— 故障发生时,能否在秒级检索到最新日志、追踪完整调用链,直接决定故障恢复速度。Doris 在写入和查询性能上实现了双重突破:

1. 高吞吐写入,秒级延迟落地

  • 10GB/s 级写入能力:支持每天 PB 级数据持续写入(相当于每秒处理千万条日志),轻松应对秒杀、大促等流量峰值。
  • 秒级延迟:数据写入后几秒内可查询,确保故障排查时能看到 “刚刚发生” 的问题。

相比之下,Elasticsearch 在高吞吐场景下常出现写入阻塞,ClickHouse 的实时性则受限于分区合并机制,而 Doris 通过单副本写入、时序 Compaction等优化,在高流量下仍能保持稳定延迟。

2. 全文检索与聚合分析双引擎

  • 极速全文检索:针对日志、链路追踪等文本数据,Doris 优化的倒排索引比 ClickHouse 快 3-10 倍,关键词检索秒级响应。
  • MPP 分布式聚合:在指标分析场景(如 QPS 趋势、响应时间分布)中,性能是 Elasticsearch 的十几倍倍,支持千万级数据实时聚合。

二、成本减半:存储与计算双重优化

可观测性数据的 “海量 + 低价值密度” 特性,让成本成为企业痛点 ——TB 级日志存储半年的成本,甚至可能超过业务数据库。Doris 通过技术创新将成本压缩 50%-80%:

1. 存储成本直降 50%+

  • 超高压缩比:采用列式存储 + ZSTD 压缩,结合倒排索引简化设计,压缩比达到 5:1-10:1(Elasticsearch 仅 1.5:1)。按每天 1TB 数据计算,一年可节省数百 TB 存储。
  • 冷热分层存储:将超过 30 天的冷数据迁移至 S3/HDFS,存储成本再降 50%,同时不影响查询灵活性。

2. 计算资源节省 70%

  • 向量化索引构建:倒排索引生成效率比 Elasticsearch 高 3 倍,写入阶段 CPU 占用降低 70%。
  • 智能 Compaction:时序数据合并策略减少写放大,避免频繁磁盘 IO 消耗资源。

三、生态开放:无缝对接现有工具链

可观测性建设最怕 “生态锁定”,Doris 以开放姿态兼容主流工具,无需重构现有体系:

  • 数据采集:支持 OpenTelemetry、Logstash、Filebeat 等开源采集工具,兼容 ELK 生态的日志管道。
  • 可视化分析:无缝对接 Grafana、Kibana,提供类 Kibana 的交互式检索界面,工程师无需学习新语法。
  • 查询接口:支持标准 SQL 和 MySQL 协议,开发人员用熟悉的SELECT语句即可完成日志检索、链路分析,门槛极低。

相比之下,Elasticsearch 的 DSL 语法学习成本高,ClickHouse 的运维复杂度高,而 Doris 让可观测性平台的搭建和使用门槛大幅降低。

四、灵活 schema:应对日志数据的 “善变” 特性

日志和链路数据常以 JSON 格式存在,字段动态变化(如新增埋点字段、日志格式升级),传统数据库难以适配。Doris 的VARIANT 半结构化类型完美解决这一问题:

  • 自动识别 JSON 内部字段,无需预先定义 schema;
  • 支持字段类型动态变更(如从字符串改为数值);
  • 高频字段自动列式存储,兼顾灵活性与查询性能。

例如,当业务新增 “用户等级” 日志字段时,Doris 无需修改表结构即可直接检索该字段,省去繁琐的 schema 迁移工作。

五、谁在选择 Doris 做可观测性?

目前,Doris 已被多家企业用于构建可观测性平台,以下案例供参考:

  • 网易灵犀办公 :灵犀 Eagle 监控平台使用 Apache Doris 全面替换 Elasticsearch。升级后,得益于 Doris 的列式存储和 ZSTD 高压缩比,存储同样日志数据,存储空间从 100T 降至 30T,节省 70%。查询性能上,Doris 耗时稳定且均低于 4 秒,最快 1 秒内响应,而 Elasticsearch 耗时波动大,最长达 75 秒,Doris 查询效率至少是其 11 倍 。
  • 360 企业安全浏览器:原 Elasticsearch 存在索引膨胀(月增 200TB)、关联查询慢(如攻击 IP 与用户表 JOIN 需 5 分钟)等问题,引入 Doris 后,606GB 日志写入时间从 8 小时缩至 2 小时,存储成本降 80%(单表从 697GB 减至 195GB),聚合分析效率呈数量级提升。

总结:Doris 让可观测性 “又快又省”

在可观测性场景中,Doris 通过 “高性能写入 + 极速查询” 保障实时性,通过 “高压缩 + 开放生态” 降低成本,成为企业构建可观测性平台的理想选择。

如果你正面临日志存储成本高、查询慢、生态封闭等问题,不妨试试 Doris—— 用 SQL 玩转日志、链路和指标分析,让可观测性从 “成本中心” 变为 “效率引擎”。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-08-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据极客圈 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、性能碾压:实时写入与极速查询双突破
    • 1. 高吞吐写入,秒级延迟落地
    • 2. 全文检索与聚合分析双引擎
  • 二、成本减半:存储与计算双重优化
    • 1. 存储成本直降 50%+
    • 2. 计算资源节省 70%
  • 三、生态开放:无缝对接现有工具链
  • 四、灵活 schema:应对日志数据的 “善变” 特性
  • 五、谁在选择 Doris 做可观测性?
  • 总结:Doris 让可观测性 “又快又省”
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档