搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏上云服务专题
ApacheDoris分析型数据库
更多请前往官网：ApacheDoris官网
1.1K10编辑于 2022-12-01
来自专栏大数据成神之路
ApacheDoris系列｜Bucket(分桶)数量设置和自动分桶
问题描述：上线运行一段时间后，随着越来越多的数据增长，集群每次重启后一周左右，读写就会开始变得越来越慢，直到无法正常进行读写。
2.8K32编辑于 2023-09-06
从 Snowflake 到 Apache Doris：Planet 实时分析成本直降 80%、查询加速 90 倍
为何选择ApacheDoris基于对ApacheDoris和ClickHouse在性能、灵活性、数据集成和成本效益等关键指标上的详细对比测试与概念验证(POC)后，他们最终选定ApacheDoris。从Snowflake到ApacheDoris架构演进在迁移过程中，Planet数据团队制定了一套分阶段、系统化的实施方案，以确保稳定性与性能优化，同时充分利用ApacheDoris对MySQL协议的兼容性 ApacheDoris实战总结基于真实业务场景的深度验证，ApacheDoris在核心分析场景中展现出显著的性能优势：标准OLAP查询：针对2000万行数据的过滤聚合（filter+agg）测试，ApacheDoris +EBS基础设施上的ApacheDoris后，总月度成本仅约**25,000∗∗；迁移至部署在AWSEC2+EBS基础设施上的ApacheDoris后，总月度成本仅约∗∗5,000，实现了5倍的成本节约存储效率持平：得益于列存压缩技术，ApacheDoris存储空间占用与Snowflake相当，消除容量扩展顾虑；全链路加速：从数据摄入到查询响应，ApacheDoris以原生MySQL兼容性简化开发适配
20410编辑于 2025-11-18
Apache Doris 登顶 RTABench，实时分析性能详情来了
近日，实时分析领域知名Benchmark——RTABench（Real-TimeAnalyticsBenchmark）最新榜单公布，ApacheDoris以绝对领先的成绩登顶，结果表明，ApacheDoris ApacheDoris领跑全场，性能优势明显01性能对比在最新榜单中，ApacheDoris表现惊艳：Doris（c6a.4xlarge，500GBgp2）查询性能得分仅为×1.28，在此项指标上位列第一 02固定机型下的竞争在c6a.4xlarge的同机型条件下，与部分传统数据库相比，ApacheDoris展现出数十倍的性能优势。正是凭借这些组合，ApacheDoris在RTABench的实时分析测试中，取得了远超TimescaleDB、ClickHouse、MongoDB、PostgreSQL等数据库的成绩，登顶榜首。无论是初创团队还是大型企业，ApacheDoris都能帮助业务在毫秒级洞察中抢占先机。
21000编辑于 2025-11-19
来自专栏Apache Doris
宇信科技基于 SelectDB & Apache Doris 构建实时智能的银行经营分析平台
为解决这一核心难题，宇信自2023年开始与ApacheDoris合作，目标构建一个将数据洞察无缝融入业务执行的全新平台。 ApacheDoris构建高效、智能的分析平台宇信科技与ApacheDoris的深度融合，是构建现代化银行经营分析平台的关键。 ApacheDoris作为核心加速引擎和数据存储组件，在提升数据处理效率、实现流批一体化以及打破数据孤岛方面发挥了决定性作用。某银行业务场景的成功实践宇信科技与ApacheDoris为某银行的零售业务打造了全新的经营分析平台。二者均依托ApacheDoris强大的实时分析能力和快速响应能力。为实现"全渠道触达，分层经营"的业务目标，平台还基于ApacheDoris构建了覆盖多维度、多层次的指标体系。
16110编辑于 2025-11-28
来自专栏Apache Doris
面向 Agent 的高并发分析：Doris vs. Snowflake vs. ClickHouse
1.查询吞吐（QPS）全面领先进入AI时代，ApacheDoris继续保持技术领先。 2.ApacheDoris为何能够领先？承接前文基准测试中展现出的卓越吞吐性能，接下来介绍为何ApacheDoris在高并发查询上能全面领先其他同类型产品，其背后有哪些能力或技术支持？在ApacheDoris中，过滤掉不必要的数据，只读取最小的数据子集，这被称为“数据裁剪”，是查询加速的主要手段之一。现在我们探讨ApacheDoris中的静态过滤器——谓词过滤。对于一张普通的表，其列可分为分区列、键列和值列三种类型。在ApacheDoris中，向量化执行引擎为实际应用场景带来了显著的查询性能提升。数据压缩、循环计算等操作也因此得到大幅加速。
10200编辑于 2025-12-15
来自专栏Apache Doris
快手：从分散存储到统一分析，Apache Doris 在万亿规模广告场景的应用
因此，重点在Elasticsearch与ApacheDoris之间进行对比。因此，我们最终选定ApacheDoris作为下一代广告数据分析引擎。 03基于ApacheDoris的统一分析引擎在实际应用中，我们引入ApacheDoris（计算引擎）替换了原先架构中的Elasticsearch、ClickHouse，设计了统一分析引擎Bleem。计算层：ApacheDoris为核心引擎。不同项目组对应不同的Doris集群，以实现计算资源物理隔离，用户可按需申请计算资源。 02StreamLoad机制优化为应对高并发数据导入，我们对ApacheDoris的StreamLoad机制进行了调优。
14210编辑于 2026-02-02
来自专栏Apache Doris
字节跳动：Apache Doris + AI 一站式融合数据引擎的探索与实践
ApacheDoris凭借完善的功能、卓越的OLAP性能、丰富的生态体系、活跃的社区氛围及良好的产品口碑吸引了我们的注意。行业内普遍采用NL2SQL直接查询ApacheDoris等数据库的模式。那么，字节是如何落地的呢？在这其中，ApacheDoris主要作用是将湖上的数据同步到其内部进行查询加速。将数据加速至ApacheDoris相当于复制一份数据，可能导致安全管控失效。为解决这一问题，我们设计了机制：即使数据同步至ApacheDoris，其权限仍受Triton数据湖权限系统管控，且与ApacheDoris的账号密码无关。
38800编辑于 2025-12-03
来自专栏Apache Doris
更高效的数据处理解决方案：基于 MinIO 部署 Apache Doris 存算分离版本实践
ApacheDoris作为一款具备高性能的实时分析数据库，拥有湖仓一体的能力。当它与MinIO这样高性能且S3兼容的对象存储系统相结合时，能够构建出一个高效且具备低成本特性的数据分析系统。本文将介绍基于ApacheDoris和MinIO的存算分离部署教程与使用实践。为什么选择ApacheDoris和MinIOApacheDoris是一款基于MPP架构的高性能、实时分析型数据库。这些特性使Minio成为ApacheDoris存算分离架构的理想存储后端。通过结合MinIO和ApacheDoris的存算分离架构，用户可以充分利用Minio的高性能、低成本对象存储和Doris的实时分析能力。
35310编辑于 2025-11-26
为什么实时更新场景下 Doris 查询性能是 ClickHouse 的 34 倍
OLAP系统的选择：为什么是ApacheDoris？快手通过引入ApacheDoris湖仓一体能力替换ClickHouse，升级为湖仓一体架构，涉及数十万张表、数百PB的数据增量处理。在高并发处理场景中，ApacheDoris的MPP架构为平台提供了强大的并发查询支撑能力：即席查询能力：原架构每次新需求都需要在Hive中开发测试数据模型，写入MySQL调度任务。现在ApacheDoris拥有全量明细数据，面对新请求只需配置查询条件即可执行即席查询，仅需低代码配置即可响应新需求。显著收益：数据仓库架构更加简单，对开发者和运维人员更加友好，2个ApacheDoris集群承载数十TB数据，为客户提供实时、准确的企业信息查询服务。
24700编辑于 2025-11-19
来自专栏Apache Doris
Apache Doris 在小米统一 OLAP 和湖仓一体的实践
小米早在2019年便引入ApacheDoris作为OLAP分析型数据库之一，经过五年的技术沉淀，已形成以Doris为核心的分析体系，并基于2.1版本异步物化视图、3.0版本湖仓一体与存算分离等核心能力优化数据架构本文将详细介绍小米数据中台基于ApacheDoris3.0的查询链路优化、性能提升、资源管理、自动化运维、可观测等一系列应用实践。 ApacheDoris在小米内部应用广泛，业务涵盖汽车、手机领域（包括手机系统应用与硬件制造）、互联网、线上线下销售与服务、底层平台以及新业务等多个领域，支撑着多样化的数据分析需求。自2019年在小米内部投入应用以来，ApacheDoris逐渐从中脱颖而出，发展成为小米数据架构的核心引擎。一方面，ApacheDoris整合了内部复杂的OLAP分析体系，统一承载起原本由多系统分散提供的查询能力；另一方面，Doris凭借出色的查询性能与良好的生态兼容，配合Trino、Spark、Iceberg
35110编辑于 2025-12-02
来自专栏Apache Doris
5 倍性能提升，Apache Doris TopN 全局优化详解｜Deep Dive
为了帮助用户快速获取目标数据，ApacheDoris针对TopN类型查询进行了全局优化，可将此类查询的性能提升约5倍；同时，优化范围也从单表进一步拓展至数据湖场景与多表关联查询，显著扩大了适用范围。 TopN查询优化思路为直观说明TopN查询的性能瓶颈，我们不妨将其简化为列式存储文件的读取场景，比如访问ApacheDoris内部Segment文件，或访问数据湖中常见的Parquet/ORC文件。全局TopN优化实现基于上述思路指引，ApacheDoris完成了对TopN的全局优化。 ##优化前后性能表现ApacheDoris对于TopN的优化已在多种场景上得到验证。秀干终成栋，精钢不作钩"，在“极致性能”的探索路上，ApacheDoris永不止步。
17410编辑于 2025-12-30
来自专栏暴走大数据
Apache Doris 的一场编译之旅
apachedoris/doris-dev apachedoris/doris-dev:build-env-1.2 版本 JDK 为 1.8.0_211（需自己配置 jdk 环境变量） CMake 版本为官方提供的 Docker 镜像 # 可访问上面的连接，获取可用的镜像版本 # 目前可用版本有：build-env、build-env-1.1、build-env-1.2、、 docker pull apachedoris /doris-dev build-env-1.2 87dfd327471f 5 months ago 3.26GB #apachedoris/doris-dev root/.m2 \ -v /u01/incubator-doris-DORIS-0.13.0-release/:/root/incubator-doris-DORIS-0.13.0-release/ \ apachedoris " \ --privileged=true --cap-add SYS_ADMIN \ -d apachedoris/doris-dev:build-env-1.2 /usr/sbin/init #
5.4K50发布于 2021-04-21
Apache Doris 4.0 的 AI 功能：操作指南和脚本（LLM 函数 + 向量索引）与 CMP 7.3（ Cloudera CDP 7.3 华为鲲鹏)
ApacheDoris4.0的AI功能：操作指南和脚本（LLM函数+向量索引）与ClouderaCDP7.3（或类CDP的CMP7.13平台，如华为鲲鹏ARM版）操作指南和脚本以下是在启用TLS+Kerberos 的ClouderaCDP7环境中，部署ApacheDoris4.0并实现与外部云上LLM（如Qwen/DeepSeek）集成的完整操作指南和脚本。 doris.keytabchowndoris:doris/etc/security/keytabs/doris.keytab⚠️注意：doris用户需提前创建：Bash:useradd-mdoris第二步：部署ApacheDoris4.02.1 （检查DorisFE日志是否有LLM调用记录）·网络：Doris节点可curl-vhttps://dashscope.aliyuncs.com通过以上步骤，你已在安全加固的CMP7.13环境中成功集成ApacheDoris4.0
25110编辑于 2025-11-13
来自专栏CU技术社区
SelectDB肖康：Apache Doris在日志存储与分析场景的实践
日志场景解决方案作为 ApacheDoris的商业化公司，SelectDB团队基于 ApacheDoris内核开发了云原生版本 SelectDBCloud，并推出了面向日志分析场景的解决方案。关于开源 SelectDB一直秉承开源开放的价值观，对于上面介绍的倒排索引、TopN优化、时序Compaction优化等关键技术，已经贡献到ApacheDoris社区，预计在2023年Q1的Doris 2.0版本中正式发布，2月份也会开放Doris 2.0 preview版本供大家试用，欢迎刚兴趣的朋友们参与试用和技术交流，一起繁荣ApacheDoris社区。
2.1K20编辑于 2023-03-02
Apache Doris 自动分区：如何应对分布式环境下的复杂并发挑战｜Deep Dive
本文深度、详尽的讲解ApacheDoris自动分区设计思考，并就多线程复杂并发场景下所面临的挑战，一一剖析Doris自动分区设计时的应对策略。 ApacheDoris的自动分区功能正是在这一背景下应运而生。自动分区的实现在ApacheDoris这样的大规模数据仓库中，分区对性能影响较大。 ApacheDoris早已支持自动分区（AutoPartition）功能，可在数据导入时自动创建数据所对应的分区，节省了人工操作及维护成本。那么，自动分区功能如何实现的呢？ ApacheDoris自动分区的并发实践揭示了一个核心启示：应对复杂并发，并非要设计一个包罗万象的复杂模型，而恰恰在于通过精妙的分解与转化，将未知问题映射到已知领域。
20610编辑于 2025-11-16
来自专栏857-Bigdata
百度数据仓库Palo Doris版安装部署往这看！
CentOS 用户通过以下命令快速安装 Docker： yum -y install docker-io service docker start 下载 Docker 编译镜像： docker pull apachedoris /doris-dev:build-env-1.2 docker pull apachedoris/doris-dev:build-env-1.3 注: 针对不同的 Doris 版本，需要下载对应的镜像版本镜像版本commit iddoris 版本apachedoris/doris-dev:build-env-1.24ef5a8c0.12.x, 0.13apachedoris/doris-dev:build-env -1.3ad67dd30.14.x 或更新版本注意: Doris 0.14.0 版本仍然使用apachedoris/doris-dev:build-env-1.2 编译，之后的代码将使用apachedoris docker run -it -v /local/path/to/.m2:/root/.m2/ -v /local/path/to/doris-src/:/root/doris apachedoris/
96120编辑于 2022-05-17
Apache Doris 数据导入原理与性能优化 | Deep Dive
概述对于ApacheDoris这样的高性能分析型数据库而言，高效、稳定的数据导入是保障实时分析能力的生命线。 ApacheDoris本文将深入剖析Doris数据导入的核心原理，涵盖关键流程、组件、事务管理等，探讨影响导入性能的因素，并提供实用的优化方法和最佳实践，有助于用户选择合适的导入策略，优化导入性能。 MemTable前移MemTable前移是ApacheDoris2.1.0版本引入的优化机制，针对INSERTINTO…SELECT导入方式显著提升性能，官方测试显示该优化使得单副本导入耗时缩短约64% Doris数据导入的延迟与吞吐取舍在使用ApacheDoris时，数据导入的延迟（Latency）与吞吐量（Throughput）往往需要在实际业务场景中进行平衡：更低延迟：意味着用户能更快看到最新数据 8核CPU、16GB内存3台BE：16核CPU、64GB内存数据集：TPCHlineitem数据不同攒批时间和不同并发下的导入性能，测试结果如下：不同bucket数对导入性能的影响，测试结果如下：总结ApacheDoris
28410编辑于 2025-11-18
来自专栏Apache Doris
Apache Doris 4.0.3 版本正式发布
亲爱的社区小伙伴们，ApacheDoris4.0.3版本已正式发布。此版本新增了在AI&Search、湖仓一体、查询引擎等方面的能力，并同步进行了多项优化改进及问题修复，欢迎下载体验！
9910编辑于 2026-02-12
来自专栏Apache Doris
深入理解 Doris Variant：如何让 JSON 查询性能追平列存，还能承载万列索引字段？｜Deep Dive
摘要：在如Snowflake、ElasticSearch、ClickHouse....等传统系统中，对于JSON的处理往往面临灵活性及性能无法兼得的困境，而ApacheDoris的VARIANT类型，通过动态子列 3.3客户使用反馈度小满实现从Greenplum到ApacheDoris的平滑迁移，构建了超大规模数据分析平台。 ——观测云某全球领先的新能源与智能制造企业将原有Hive/Kudu+Impala/Presto体系迁移到ApacheDoris，构建了面向车联网与装备全生命周期的实时分析平台。 ——零跑汽车四、结束语ApacheDoris的VARIANT类型，让半结构化数据能在列式引擎中被自然地处理。未来，ApacheDoris将进一步增强Variant自动Schema推导能力，支持更丰富的类型、更强大的子列索引系统，并优化稀疏列的数据查询。
26910编辑于 2025-11-24

第 2 页第 3 页

点击加载更多

ApacheDoris分析型数据库

ApacheDoris系列｜Bucket(分桶)数量设置和自动分桶

从 Snowflake 到 Apache Doris：Planet 实时分析成本直降 80%、查询加速 90 倍

Apache Doris 登顶 RTABench，实时分析性能详情来了

宇信科技基于 SelectDB & Apache Doris 构建实时智能的银行经营分析平台

面向 Agent 的高并发分析：Doris vs. Snowflake vs. ClickHouse

快手：从分散存储到统一分析，Apache Doris 在万亿规模广告场景的应用

字节跳动：Apache Doris + AI 一站式融合数据引擎的探索与实践

更高效的数据处理解决方案：基于 MinIO 部署 Apache Doris 存算分离版本实践

为什么实时更新场景下 Doris 查询性能是 ClickHouse 的 34 倍

Apache Doris 在小米统一 OLAP 和湖仓一体的实践

5 倍性能提升，Apache Doris TopN 全局优化详解｜Deep Dive

Apache Doris 的一场编译之旅

Apache Doris 4.0 的 AI 功能：操作指南和脚本（LLM 函数 + 向量索引）与 CMP 7.3（ Cloudera CDP 7.3 华为鲲鹏)

SelectDB肖康：Apache Doris在日志存储与分析场景的实践

Apache Doris 自动分区：如何应对分布式环境下的复杂并发挑战｜Deep Dive

百度数据仓库Palo Doris版安装部署往这看！

Apache Doris 数据导入原理与性能优化 | Deep Dive

Apache Doris 4.0.3 版本正式发布

深入理解 Doris Variant：如何让 JSON 查询性能追平列存，还能承载万列索引字段？｜Deep Dive

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐