首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 查询提速11倍、资源节省70%,Apache Doris 在网易日志和时序场景的实践

    ,相较于 Elasticsearch,Apache Doris 查询速度至少提升 11 倍,存储资源的节省高达 70%。 由于存储空间大幅节省,在同样的成本下可以使用 SSD 代替 HDD 存储热数据,又带来更大的查询性能提升。查询提速 11 倍:新架构以更低的 CPU 资源消耗带来了数十倍的查询效率提升。 在更低的资源占用下,Doris 的查询效率至少是 Elasticsearch 的 11 倍。 支持高吞吐写入:线上平均 500M/s、峰值 1GB/s 的写入流量,InfluxDB 使用 22 台服务器,CPU 资源使用率约 50%,而 Doris 仅使用 11 台机器,CPU 使用率约 50% 同时,查询响应也得到了显著的提升,相较于 Elasticsearch ,查询效率至少提升了 11 倍。此外,Doris 具备更高的压缩比,存储资源相较之前可节约 70%。

    1.3K10编辑于 2024-05-06
  • 来自专栏自动化、性能测试

    MongoDB(11)- 查询数组

    对数组字段中的元素指定单个条件 语法格式 { <array field>: { <operator1>: <value1>, ... } } { 数组字段名 : { 操作符:值, 操作符2: 值2, ..... }} 实际栗子 查询数组 item" : "postcard", "qty" : 45, "tags" : [ "blue" ], "dim_cm" : [ 10, 15.25 ] } dim_cm 数组包含在某种组合中满足查询条件的元素 满足大于 15 的条件 满足小于20的条件 同时满足这两个条件 多个条件是或的关系 查询满足多个条件的数组元素 上面的栗子虽然指定了复合条件,但只需要满足其中一个就匹配成功 如果想必须同时满足多个条件呢 使用 $elemMatch 运算符在数组元素上指定多个条件,使得至少一个数组元素满足所有指定条件 小栗子 查询 dim_cm 数组包含至少一个大于 (gt) 22 且小于 (lt) 30 的元素的文档 查询 dim_cm 数组第二个元素大于 25 的文档(索引位置从 0 开始哦) > db.inventory.find( { "dim_cm.1": { $gt: 25 } } ) { "_id" :

    2.8K10发布于 2021-06-09
  • 来自专栏应用计算

    SPL轻量级文件存储提速查询实践

    把不再变化的历史数据存储成轻量级的 esProc SPL 列存文件,可以利用 SPL 语言的强大计算能力,跑出远超传统数据库的查询性能。 esProc SPL 很轻,直接嵌入应用就可以运行,在实现数据外置提速的同时,也不会让整个系统架构变得很复杂:这里准备了一套使用 SPL 外置数据提速查询的实践方法:第一篇 - 常规过滤及分组汇总第二篇 枚举字段条件过滤其中涉及的实例都是传统数据库很头疼的性能问题,比如 COUNT DISTINCT,外键 JOIN,大主子表关联(包括 EXISTS),枚举字段条件过滤(包括 IN)等,助您突破数据库查询性能瓶颈 如果遇到问题可以前往乾学院查阅教程和函数参考:实践使用的测试环境是 VMWARE 虚拟机,8 核 CPU,8G 内存,SSD 硬盘,操作系统是 Win11,MYSQL 版本是 8.0,esProc SPL

    25410编辑于 2025-08-26
  • 来自专栏沉浸式AI

    告别DeepSeek卡顿,直接提速11倍多

    三种注意力模式分工合作,绿色区域代表实际计算部分 这种设计让计算量骤减——原本需要处理 6 万个词,现在只需关注约 5 千个关键点,同时通过硬件级优化(如连续内存读取、Tensor Core 加速),让理论提速真正落地 图 5) ▲ 图 5 | 64k 上下⽂⻓度的上下⽂位置上的⼤海捞针检索准确率 • 推理能力:经过专项训练后,NSA 解决美国数学竞赛题的正确率比传统模型高出 60% 更关键的是速度优势: • 训练提速 :处理 6.4 万长度文本时,前向计算提速 9 倍,反向传播提速 6 倍 • 解码飞跃:生成同样内容,内存读取量减少 90%,实际响应速度提升 11.6 倍 四、突破性创新:从“事后补救”到“原生设计”

    73810编辑于 2025-02-21
  • 来自专栏路人甲Java

    Mybatis系列第12篇:掌握缓存为查询提速!

    最终效果应该是查询1访问db拿去数据,然后将其丢到一级缓存中,查询2会直接从一级缓存中拿到数据,而查询3走的是getList2,发现flushCache为true,会先清空一级缓存中所有数据,也就是此时查询 1放入缓存的数据会被清理掉,然后查询3会访问db获取数据,然后丢到缓存中;而查询4走的是getList2,发现flushCache为true,会先清空缓存,所以3放入一级缓存的数据会被清空,然后导致查询 4也会访问db,查询5去一级缓存中查询数据,因为查询1和2放入缓存的数据都被查询3清空了,所以导致查询5发现一级缓存中没有数据,也会访问db去获取数据。 一二级缓存共存时查询原理 一二级缓存如果都开启的情况下,数据查询过程如下: 当发起一个查询的时候,mybatis会先访问这个namespace对应的二级缓存,如果二级缓存中有数据则直接返回,否则继续向下 db,第二次查询从二级缓存中获取了数据,第3和第4查询访问的是getList2,这个查询会清空二级缓存中的数据,直接去db中查询查询4执行完毕之后,二级缓存中只有第四次查询的数据,第5次查询去getList1

    67220发布于 2020-02-18
  • 来自专栏bisal的个人杂货铺

    查询提速10倍的SQL性能优化场景方案介绍

    仅一行SQL,查询时间提速10倍!》通过不同的方案,讲解一个常见场景的优化,而且有些设计思路可以借鉴到实际的应用系统设计中,让其性能水准得到充分发挥。

    15010编辑于 2025-11-12
  • 来自专栏腾讯云大数据

    行业独家 | 腾讯云ES:PB日志查询提速,自治索引查询裁剪详解!

    作者:腾讯云大数据ES团队 背景概述 日志场景一般具有明显的冷热特点,比如保留7天的日志数据,但P90查询都集中在近12小时,并且在查询日志时一般使用索引前缀查询,比如filebeat-*,这种查询比指定索引名查询 查询裁剪示意图 注:理论上,所需查询的时间范围与数据总的实际时间范围差距越大,查询裁剪优势越明显。  " : { "range" : { "@timestamp" : { "gte" : "2022-11 -01T03:07:34.348+08:00", "lt" : "2022-11-02T03:07:34.348+08:00" format=txt{"query": "SELECT * FROM index_name WHERE @timestamp < '2022-11-01'"} ‍ 总结 本文从日志场景的查询特点出发,对

    84320编辑于 2022-11-22
  • 来自专栏数据分析

    PostgreSQL并行查询:让特征计算提速5倍的方法

    1.2 并行查询的破局之道PostgreSQL 9.6+引入的并行查询机制,通过Gather节点协调多个worker进程并行扫描、聚合和连接表,理论上可将OLAP场景性能线性提升。 MVCC机制的交互可能引发意外的锁竞争二、并行查询核心原理解析2.1 执行计划树的重构魔法传统串行查询的执行计划是单一树状结构,而并行查询会在计划树中注入Gather或Gather Merge节点,形成 event_timestamp月分区优秀低时间范围查询为主user_id哈希分区良好中用户级点查询location_city列表分区一般高地域分析场景4.2 串行实现与性能基线原始PL/pgSQL实现: BRIN支持时间序列顺序数据极低极低HASH不支持等值查询(内存表)低中GIN部分支持全文检索/JSON高高GiST部分支持空间数据高高6.2 JIT编译与向量化执行PostgreSQL 11+引入的LLVM main "$@"七、监控告警与故障诊断7.1 并行查询专属监控视图-- 创建并行查询实时监控视图CREATE OR REPLACE VIEW v_parallel_activity ASSELECT

    49230编辑于 2025-12-11
  • 来自专栏wuter

    JavaWeb后端入门11—条件查询

    1.1 应用场景 商品列表页面加一个查询功能,条件有商品名称、是否热门、商品类别,其中是否热门和商品类别可以选择不限。点击查询后输出符合条件的商品列表。 Dao里面的分类查询是核心,也是最难和最有技巧的地方 1.2 前端界面 查询按钮处的表单: <form id="Form1" name="Form1" action="${pageContext.request.contextPath }/SearchProductListServlet" method="post"> <%--查询功能的实现 --%> 商品名称: <input type="text" name="pname">     select>     <input type="submit" value="搜索" style="margin-right: 200px;"> </form> 1.3 建立一个VO实体层,用于存放查询信息 cn.wuter.domain.Product; import cn.wuter.vo.Condition; public class SearchProductListService { //根据条件查询商品列表的

    28400编辑于 2025-04-03
  • 《前端开发者必看:IndexedDB海量数据查询提速秘籍》

    但当数据量庞大时,索引的维护和查询效率会受到严峻考验。并非所有字段都适合建立索引。要依据实际查询需求,挑选那些在查询条件中频繁出现的字段。 当查询涉及多个字段时,复合索引能发挥巨大作用。以社交应用为例,若要查询特定城市且年龄在一定范围内的用户,单独为城市和年龄字段建立索引可能无法满足高效查询需求。 当查询特定时间段或类型的图片时,只需在相应的分片数据中查找,减少查询范围,提高查询速度。规范化数据结构能减少数据冗余,确保数据一致性,但在查询时可能需要进行多表关联,增加查询复杂度。 要根据具体应用场景和查询需求,灵活权衡两者的使用。在前端应用中设置内存缓存,将频繁查询的数据存储在内存中。当再次查询相同数据时,可直接从内存中获取,无需访问IndexedDB。 例如在一个天气应用中,用户经常查询当地天气信息,将最近一次查询结果缓存到内存中,下次查询时若数据未过期,即可快速返回结果,减少数据库查询次数,提高响应速度。

    34510编辑于 2025-07-04
  • 来自专栏ElasticSearch一站式学习

    11篇-Elasticsearch查询方法

    Elasticsearch中的映射方式—简洁版教程 08.Elasticsearch中的分析和分析器应用 09.在Elasticsearch中构建自定义分析器 10.Kibana科普-作为Elasticsearhc开发工具 11 Elasticsearch查询类型 Elasticsearch中的查询可以大致分为两类, 1.叶子查询 叶子查询在某些字段中查找特定值。这些查询可以独立使用。其中一些查询包括匹配,条件,范围查询。 2.复合查询 复合查询使用叶/复合查询的组合。基本上,它们将多个查询组合在一起以实现其目标结果。 基本查询样本 现在,让我们熟悉叶子的2个基本查询和复合查询类型中的一个查询以开始操作。 2.范围查询 现在让我们触发另一个查询,这个查询也是一个叶子查询

    4.4K00发布于 2020-06-08
  • 来自专栏C博文

    PostgreSQL窗口函数避坑指南:如何让复杂分析查询提速300%?

    本文基于真实企业级优化案例,通过剖析窗口函数的执行原理与常见陷阱,结合8个深度优化策略,将原本耗时分钟级的分析查询压缩至秒级响应。所有代码均通过PostgreSQL 15验证。 1 窗口函数的性能陷阱:为什么你的分析查询越来越慢? 窗口函数(Window Functions)是SQL分析场景的核心工具,但在处理海量数据时极易成为性能瓶颈。 ) 注意事项: 窗口函数需满足PARTITION BY可并行拆分 避免使用ROWS BETWEEN等依赖全局排序的框架 增大work_mem保障每个worker内存充足 4 实战案例:电商用户行为分析提速 通过预计算和存储窗口函数结果,将实时计算转化为静态查询。 某金融客户在优化后,其风险分析查询从原来的47秒降至0.8秒,效率提升达5800%。

    50610编辑于 2025-07-15
  • 来自专栏数据分析

    如何用 esProc 将数据库表转储提速查询

    数据量大或者数据库繁忙都会导致数据库查询变慢,这时将数据用 esProc 导出存成文件再计算可以大幅提升性能。 INDelivered330032023-03-15703Laptop Air11099.991099.99Credit Card101 Tenth Rd, Seattle, WADelivered数据量:3 千万行两个样例查询 31' AND quantity > 1 AND total_amount < 1000 GROUP BY payment_method, order_status;查询时间 orders)SELECT * FROM ranked_ordersWHERE amount_rank <= 3ORDER BY product_name, amount_rank;查询时间 :63.22s现在用 esProc 将数据转储成文件加速查询

    67000编辑于 2025-04-23
  • 来自专栏自动化、性能测试

    Mysql常用sql语句(11)- between and 范围查询

    Mysql常用sql语句系列 https://www.cnblogs.com/poloyy/category/1683347.html 前言 between and可以判断值是否在指定范围内 实际场景:可以查询年龄段 between and 栗子 栗子一:查询年龄在19-21之间的记录 select * from yyTest where age between 19 and 21; ? 栗子二:查询年龄不在19-21之间的记录 select * from yyTest where age not between 19 and 21; ?

    2.6K10发布于 2020-06-09
  • 来自专栏超级架构师

    【PostgreSQL 架构】PostgreSQL 11和即时编译查询

    在我的测试中,执行TPCH Q1查询时,PostgreSQL 11比PostgreSQL 10快29.31%。 在循环中运行查询10分钟时,当PostgreSQL 10仅执行同一查询时,它允许PostgreSQL 11执行30次。21次。 ? 在此基准测试中,我们选择在PostgreSQL中禁用并行查询,以便评估主要由新执行程序导致的改进。PostgreSQL 10 then 11中的并行支持能够大大增强我们在此看到的查询时间! 在PostgreSQL 11中,由于在查询计划时使用LLVM编译器基础结构,SQL表达式已转换为机器代码,这对查询性能产生了另一个非常好的影响! 原文:https://www.citusdata.com/blog/2018/09/11/postgresql-11-just-in-time/ 本文:http://jiagoushi.pro/node

    2.3K20发布于 2020-07-20
  • 来自专栏函数式编程语言及工具

    search(11)- elastic4s-模糊查询

    很多时候搜索用户对查询语句具有模糊感觉,他们只能提供大约的描述。比如一个语句的部分,或者字句顺序颠倒等。通过模糊查询可以帮助用户更准确的找出他们希望搜索的结果。 模糊查询包括前后缀,语句(phrase)查询。 前缀查询在非文本查询和全文查询字段中使用是有着不同的效果:在非文本字段查询中我们需要严格按照词字顺序进行匹配,而全文查询中由于目标字段在构建索引时已经进行了分词处理,所以匹配是在分词中进行匹配的。 *Holmes.*")) 全文查询中常用match_phrase:这是一种语句查询。 这时用前缀查询match_phrase_prefix最为合适。

    55810发布于 2020-05-18
  • 来自专栏IT云清

    11.Elasticsearch查询关键字2

    目录: 1.使用bool组和查询条件 2.相关性得分计算方式 3.filter过滤查询 4.constant_score 查询 1.使用bool组和查询条件 bool可以连接组和一下几个参数条件: 由于这是我们看到的第一个包含多个查询查询,所以有必要讨论一下相关性得分是如何组合的。每一个子查询都独自地计算文档的相关性得分。 所有查询都可以借鉴这种方式。将查询移到 bool 查询的 filter 语句中,这样它就自动的转成一个不评分的 filter 了。 如果你需要通过多个不同的标准来过滤你的文档,bool 查询本身也可以被用做不评分的查询。 这种方式可以用来取代只有 filter 语句的 bool 查询。 下一篇:12.Elasticsearch查询关键字3

    97830发布于 2019-01-22
  • 来自专栏desperate633

    11课 使用子查询使用计算字段作为子查询

    检索包含物品‘RGAN01’的所有订单号 从这个订单号里到orders表里检索出custid 再根据custid从customers的表里检索顾客的信息 上面三个步骤每个步骤都可以单独作为一个查询来执行 ,这就出现了子查询的定义。 不使用子查询“ select order_num from orderitems where prod_id = 'RGAN01'; select cust_id from orders where order_num in (20007,20008) 使用子查询: select cust_id from orders where order_num in (select order_num from orderitems where prod_id = 'RGAN01'); 使用计算字段作为子查询 假设有这么一个问题,显示customers表中的每个顾客订单的总数: 第一步,自然是检索出所有顾客的列表

    2K20发布于 2018-08-22
  • 来自专栏数据和云

    SQL查询提速秘诀,避免锁死数据库的数据库代码

    于是,他查询住在加利福尼亚州的客户,把查询结果放到一个临时表中。 然后再来查询年收入高于 4 万美元的客户,把那些结果放到另一个临时表中。最后他连接这两个表,获得最终结果。 你是在逗我吧? 这应该用一次查询来完成,相反你对一个超大表查询两次。别犯傻了:大表尽量只查询一次,你会发现存储过程执行起来快多了。 在查询的 SELECT 列表中使用标量函数时,该函数因结果集中的每一行而被调用,这会大幅降低大型查询的性能。 第一次查询用时 15 秒,包含 456197 个逻辑读取,第二次查询不到 1 秒就返回结果,只包含 5 个逻辑读取。 最后,我意识到这个查询违反了第 4 条规则:不要查询两次,但这也表明没有硬性规则。虽然我们在这里查询两次,但这么做是为了避免开销很大的表扫描。

    2K30发布于 2018-07-27
  • 来自专栏深度学习之tensorflow实战篇

    mongodb11天之屠龙宝刀(四)高级查询:MongoDB内嵌字段查询

    mongodb11天之获取屠龙宝刀(四)高级查询:MongoDB内嵌字段查询 实战环境 IDE:nosql manager for mongodb 表:jd_final_xiecheng_10 查询操作 1.查询表,并limit db.jd_final_xiecheng_10_15.find({}).limit(10) 2.选择字段 db.jd_final_xiecheng_10_15.find MongoDB嵌套查询 1.至查询单个键值 只针对内嵌文档的特定键值进行查询如下: 只需要匹配嵌套文档中的某个特定键值即可。 2.查询键值包含的所有键值 必须在查询条件中必须写出以xiecheng为键的所有值。

    98140发布于 2018-03-19
领券