首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏Apache Doris

    Apache Doris AI 能力揭秘(四):HSAP 一体化混合搜索架构全解

    HSAP:面向 AI 应用的混合搜索与分析处理相对而言,Hybrid Search and Analytics Processing(HSAP) 是当下更优的解决方案。 在实际执行中,HSAP 的查询流程通常呈现为简洁且高效的协同模式,流程如下:A. Apache Doris HSAP 的实现HSAP 模型提供了理想的理论框架,而 Apache Doris 则是一个将其工程化落地的典范。 接下来,我们将逐一介绍 Apache Doris HSAP 核心能力、最佳实践以及性能表现。4. HSAP 高效分析的关键如果说上述能力是构成 HSAP 混合搜索能力的技术基础,那么如何让各模块高效的协同、运转也是一大核心所在。

    19810编辑于 2025-12-22
  • 来自专栏深度学习与python

    Krypton:字节跳动新一代实时服务分析 SQL 引擎设计 | VLDB 2023 论文解读

    为了解决这个问题,我们开启了 Krypton 项目,这是字节跳动基础架构计算-实时引擎、 创新应用中心、 存储-HDFS & NoSQL 团队共同合作研发的新一代面向复杂业务的实时服务分析系统(HSAP 为了解决这个问题,我们设计了 Krypton(HSAP),系统的设计目标主要有几个点: 可伸缩。 这篇文章我们完整的展示了一个 HSAP 系统的建设历程。

    1.3K30编辑于 2023-09-08
  • 来自专栏大数据架构师成长之路

    架构师成长之路系列(二)

    + | 3 | 2020-11-13| | 3 | 2020-11-14| +---------------+ +---------------+ 实时写入和 ACID 随着实时数仓和 HTAP,HSAP 写历史数据到存储再清洗,实时数据入一些 NoSQL,使用方需要做各种数据源 merge 操作,流行的方式是流计算系统直接写 OLAP,这样避免了数据孤岛,保证了链路简单,阿里云 hologres 团队提出的 HSAP

    1.1K40发布于 2020-09-29
  • 来自专栏数据社

    建议收藏!浅谈OLAP系统核心技术点

    --+ | 3 | 2020-11-13| | 3 | 2020-11-14| +---------------+ +---------------+ 实时写入和ACID 随着实时数仓和HTAP,HSAP lambda,写历史数据到存储再清洗,实时数据入一些NoSQL,使用方需要做各种数据源merge操作,流行的方式是流计算系统直接写OLAP,这样避免了数据孤岛,保证了链路简单,阿里云hologres团队提出的HSAP

    1.5K20发布于 2020-08-27
  • 来自专栏深度学习与python

    字节跳动 DevMind:深入浅出万人规模效能度量平台的构建与演进

    2.3.2.2.4 算力工程优化思路 基于 MECE 原则的算力优化分析: 算力增加: 查询引擎替换:OLAP HSAP 查询模式升级:自建 SQL 优化器 算力利用率提升: 应用层利用率:精细化缓存 这个时候不得不提字节的明星 HSAP 架构下的实时计算引擎 Krypton,OLAP 引擎比 MySQL 快百倍以上很正常,但是要应付我们如此复杂 SQL 的场景几乎没有,仅仅是一个语法兼容性就已经打败了很多组件

    2.6K10编辑于 2023-09-08
  • 来自专栏Apache Doris

    Doris & SelectDB for AI 实操:从零搭建非结构化数据智能分析洞察系统

    我们所做的,正是通过HSAP能力在一个统一平台中融合实时分析、智能检索与AI推理能力,唤醒这些数据资产的价值。

    5600编辑于 2026-03-04
  • 来自专栏大数据技术架构

    关于OLAP数仓,这大概是史上最全面的总结!(万字干货)

    最新发展显示,有云厂商在HTAP的基础上做了某种妥协,将T(transaction)弱化为S(Serving),朝HSAP方向演进。关于HTAP/HSAP,本文不做进一步展开,可自主查询其他资料。

    6.8K54发布于 2020-07-02
  • 来自专栏深度学习与python

    后 Hadoop 时代,字节跳动如何打造云原生计算平台 | 卓越技术团队访谈录

    其中,存储层是基于 HDFS 进行深度定制的 CloudFS + Iceberg,中间件包括 Kafka 和字节自研的 BMQ,计算引擎使用的是 Spark / Flink,还包括资源调度和混部,以及 HSAP

    1.4K50编辑于 2022-11-28
  • 来自专栏深度学习与python

    AI落地的新范式,就“藏”在下一场软件基础设施的重大升级里

    DAT 自动机器学习工具包 DingoDB (开源地址:https://github.com/dingodb/dingo)是新一代集分析与服务于一体的实时分析数据库 HSAP(Hybrid Serving

    62120编辑于 2023-03-29
  • 来自专栏bisal的个人杂货铺

    国产数据库名录一览

    华为 161 火山数据库 分布式数据库 北京字跳网络技术有限公司 162 极星数据库 分布式数据库 南方电网深圳数字电网研究院 163 京东云DRDS 分布式关系型数据库 京东智联云 164 九章云极HSAP

    5K10编辑于 2022-06-30
  • 来自专栏随手写个文章

    【天穹OS】虚拟表:支持极速查询的下一代湖仓一体新范式

    如图6,Snowflake是一个中央数据仓库(湖仓一体),汇聚左侧的数据源,提供右侧的服务能力;支持多个云厂商部署,能力上可支持多种负载和国内提的HSAP类似、性能强悍,整个生态和体系非常完善、用户友好

    2.4K212编辑于 2023-10-31
  • 探索云原生分布式 Data Warebase

    隔离的实现可以通过软件层次的软隔离,感兴趣的读者可以参考 HSAP 的文章。隔离也可以通过资源层的硬隔离去实现,也就是把需要隔离的不同请求用不同的计算节点去完成。

    65410编辑于 2024-03-13
  • 来自专栏深度学习与python

    为什么又造了个新词 Data Warebase:我看到了 AI 时代数据平台应当的样子

    隔离的实现可以通过软件层次的软隔离,感兴趣的读者可以参考 HSAP 的文章。隔离也可以通过资源层的硬隔离去实现,也就是把需要隔离的不同请求用不同的计算节点去完成。

    39610编辑于 2024-03-07
领券