首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >MongoDB 查询 优化指南 四句真言 (查询 优化系列 4)

MongoDB 查询 优化指南 四句真言 (查询 优化系列 4)

作者头像
AustinDatabases
发布2026-03-12 21:25:57
发布2026-03-12 21:25:57
80
举报
文章被收录于专栏:AustinDatabasesAustinDatabases

MySQL SQL 优化指南 SQL 四句真言(优化系列 3)

SQL SERVER SQL 优化指南 四句真言 (SQL 优化系列 2)

PostgreSQL SQL 优化指南 四句真言(SQL 优化系列 1)

这是SQL优化的第四期了,这回终于转到了MongoDB。或者这个题目不对,MongoDB没有SQL,有的是自己的查询语句体系NoSQL。但大差不差,其实和传统数据库也有类似的地方。今天就说说MongoDB的SQL优化的四句真言。

文档设计很重要,NOSQL优化放后面,

索引类型比较多,遵守ESR的原则,

数据写入与更新,可以同步也异步,

聚合操作要注意,提前过滤再聚合。

MongoDB的数据库查询优化,与传统的数据库有很大的不同,举一个例子,传统数据库是先把饭做出来,在调味,而mongodb的优化应该是先把味道调整好了,在做饭。

所以这就导致一个大的问题,一般DBA没法管好MongoDB,或者没有那个思维的模式来管理,还是按照传统数据库的方式去优化,我们来挨个句子解释。

第一句是模式很重要,这里的模式就是告诉你,建集合(表)的时候非常重要,因为他是无结构化的模式,如果没有设计的规则,查询语句的撰写就更天马行空了,所以模式的选择很重要。

一对多,多对一,多对多,等设计模式在之前很多文章里面写过,同时这还与模式设计里面的嵌套,平铺,数组,等等有关。嵌套的层数不宜过多,3层就差不多了,数组可以使用,但查询中,如果调用数组里面的数据频繁,则不宜将数组里面的元素设计的太多。因为模式设计错误,就会导致查询语句的复杂性和优化的难度的提高,这也是MongoDB 高级技术工程师提出的如何使用MongoDB的分享中提到的,高速的运行查询与良好的设计是分不开的。

那么ESR原则是什么,这个MySQL的DBA肯能知道后,会温故而知新,与MySQL建立索引的原则有异曲同工之妙。ESR是什么。

👉 E (Equality) — 等值

👉 S (Sort) — 排序

👉 R (Range) — 范围

我们举一个例子,来说明这个原则

代码语言:javascript
复制
db.orders.insertMany([
  { order_id: 1, user_id: 101, status: "PAID", order_date: ISODate("2025-08-01"), total: 500 },
  { order_id: 2, user_id: 102, status: "PENDING", order_date: ISODate("2025-08-02"), total: 200 },
  { order_id: 3, user_id: 101, status: "PAID", order_date: ISODate("2025-08-05"), total: 1000 },
  { order_id: 4, user_id: 103, status: "CANCELLED", order_date: ISODate("2025-08-08"), total: 50 }
]);

db.orders.find(
  { user_id: 101, status: "PAID", total: { $gte: 500 } }
).sort({ order_date: -1 });

db.orders.createIndex(
  { user_id: 1, status: 1, order_date: -1, total: 1 }
);


一句话解释,建立索引的字段顺序是,先等值,然后把需要排序的字段放入,最后才是范围的查询字段。按照这个顺序建立的联合索引才是最优的。

第二句,索引类型较多的问题,这里简单列一下MongoDB的索引类型单键索引、复合索引、稀疏索引、部分索引、TTL 索引、全文索引、地理空间索引、哈希索引等等。

这里解释一下传统数据库中没有的索引类型

1 部分索引,部分索引可不是传统DBA理解的 ,一个字段取其中的字段值的模糊索引,NO NO NO。这个部分索引是,查询字段查那个给那个字段的值建立索引。传统DBA 估计把脑袋撞破也不理解。 举个例子吧: 我们有一个

代码语言:javascript
复制
{
  _id: ObjectId(),
  order_id: Number,
  user_id: Number,
  amount: Number,
  status: String,   // 可能的取值:CREATED, PAID, CANCELLED, REFUNDED
  created_at: Date
}

这里我们查询中的条件只有PAID

代码语言:javascript
复制

db.orders.find({ status: "PAID" })

那么我们的部分索引就建立成

代码语言:javascript
复制
db.orders.createIndex(
  { status: 1 },
  { partialFilterExpression: { status: "PAID" } }
)

db.orders.find({ status: "PAID" }).explain("executionStats")

"winningPlan": {
   "stage": "IXSCAN",
   "indexName": "status_1_partial"
}

这在传统数据库是无法实现,不能想象的,那为什么MongoDB可以这样做,原因就在于节省有效的索引空间,只记录 PAID的字段的物理位置,不查询的那些字段都不记录,最大化的通过自由的手段来优化查询,速度一定是非常快,但前提是你的理解业务。

第二个是传统DBA不曾见过的稀疏索引,稀疏索引(Sparse Index)只为存在某字段的文档建立索引。没有该字段的文档不会进入索引

我们还是举一个例子

代码语言:javascript
复制
db.orders.insertMany([
  { order_id: 1, user_id: 101, amount: 500, status: "PAID" },
  { order_id: 2, user_id: 102, amount: 200 },                 // 无 status
  { order_id: 3, user_id: 103, amount: 300, status: "PAID" },
  { order_id: 4, user_id: 104, amount: 150 }                  // 无 status
]);

db.orders.createIndex({ status: 1 }, { sparse: true });

db.orders.find({ status: "PAID" });

这里我们注意稀疏索引的特点是如果document有的有status ,有的没有则只对有status的key进行建立索引。

关于SQL优化的部分,在insert ,delete ,update等操作中如果了解业务,可以在语句中添加同步或异步的语句。在操作大量的DML语句时,在MongoDB中是可以选择数据写入的方式的,下面有几种方式案例

1 数据写入并不马上查询,但有大量的数据要写入。

代码语言:javascript
复制
db.orders.insertOne(
  { order_id: 2, user_id: 102, amount: 200, status: "CREATED" },
  { writeConcern: 0 }   // 异步写入
);

2 数据插入后,马上就要查询到,(主库插入,其他节点查询)

代码语言:javascript
复制
db.orders.updateOne(
  { order_id: 1 },
  { $set: { status: "PAID" } },
  { writeConcern: { w: "majority", j: true } }  // 等待磁盘和多数节点确认
);

以此类推,任何的操作都可以通过writeConcern 的设置来满足不同业务对于数据库DML的处理需求。

最后一句是关于聚合操作的部分,聚合操作一直是MongoDB的一个需要解决的问题,常见我们的方案是提前过滤需要过滤的数据。

下面把两种语句的写法拿出来,一个错误的,一个正确的

错误的

代码语言:javascript
复制
db.orders.aggregate([
  { $group: { _id: "$customer_id", total: { $sum: "$amount" } } },
  { $match: { total: { $gt: 1000 } } }  // 后过滤,浪费计算
]);


正确的

代码语言:javascript
复制
db.orders.aggregate([
  { $match: { status: "PAID" } },  // 先过滤
  { $group: { _id: "$customer_id", total: { $sum: "$amount" } } },
  { $match: { total: { $gt: 1000 } } }  // 再过滤聚合结果
]);

正确的写法,是将过滤数据写到前面同时减少project映射的字段,减少无效的数据传输。

对于嵌套数据的优化也有两种写法 一种错误,一种正确。

代码语言:javascript
复制
db.orders.insertMany([
  { order_id: 1, customer_id: 101, items: [{ sku: "A1", qty: 2 }, { sku: "B2", qty: 1 }] },
  { order_id: 2, customer_id: 102, items: [{ sku: "A1", qty: 1 }, { sku: "C3", qty: 5 }] }
]);

错误写法
db.orders.aggregate([
  { $unwind: "$items" },                 // 先拆全部数组
  { $match: { "items.sku": "A1" } },    // 再过滤
  { $group: { _id: "$items.sku", total_qty: { $sum: "$items.qty" } } }
]);

正确写法

db.orders.aggregate([
  { $project: { customer_id: 1, items: { $filter: { input: "$items", as: "item", cond: { $eq: ["$$item.sku", "A1"] } } } } },
  { $unwind: "$items" },                 // 只拆符合条件的数组元素
  { $group: { _id: "$items.sku", total_qty: { $sum: "$items.qty" } } }
]);

这里如果有时间类型聚合的大量需求,要在MongoDB中完成,也可以更新到MongoDB 8.0,针对于时间聚合方面,在不改变任何语句的情况下,复杂的时间序列聚合操作速度提升明显,通过block processing 的机制,提高了时间聚合操作的性能。同时对于_id object_id的直接查询,引入了expresspath的查询模式,不再通过查询计划,而是直接访问存储引擎,速度更快。

每种数据库有每种的优化的方法和特性,抓住核心,在增加需要优化的数据库本身的特性,就可以快速扩展,添加新的技能。

置顶

MySQL SQL 优化指南 SQL 四句真言(优化系列 3)

沧海要,《SQL SERVER 运维之道》,清风笑,竟惹寂寥

SQL SERVER SQL 优化指南 四句真言 (SQL 优化系列 2)

PostgreSQL SQL 优化指南 四句真言(SQL 优化系列 1)

从 Universal 环球影城 到 国产数据库产品 营销 --驴唇对马嘴

3种方式 PG大版本升级 接锅,背锅,不甩锅 以客户为中心做产品

"PostgreSQL" 不重启机器就能调整 shared buffer pool 的原理

超强外挂让MySQL再次兴盛,国内神秘组织拯救MySQL行动

AI 很聪明,但就怕脑子失忆,记忆对AI很重要

从某数据库信任“危机”,简谈危机公关

邦邦硬的PostgreSQL技术干货来了,怎么动态扩展PG内存 !

数据库信创话题能碰吗? 今天斗胆说说

企业出海数据库设计问题一角,与政策动荡下的全球数据库产品

计问题一角,与政策动荡下的全球数据库产品

《数据库江湖邪修门派:心法五式全解》

微软动手了,联合OpenAI + Azure 云争夺AI服务市场

“当复杂的SQL不再需要特别的优化”,邪修研究PolarDB for PG 列式索引加速复杂SQL运行

企业出海“DB”要合规,要不挣那点钱都不够赔的

“合体吧兄弟们!”——从浪浪山小妖怪看OceanBase国产芯片优化《OceanBase “重如尘埃”之歌》

未知黑客通过SQL SERVER 窃取企业SAP核心数据,影响企业运营

那个MySQL大事务比你稳定,主从延迟低,为什么? Look my eyes! 因为宋利兵宋老师

非“厂商广告”的PolarDB课程:用户共创的新式学习范本--7位同学获奖PolarDB学习之星

说我PG Freezing Boom 讲的一般的那个同学,专帖给你,看看这次可满意

短评 国产数据库营销市场 “问题”

这个 PostgreSQL 让我有资本找老板要 鸡腿 鸭腿 !!

DBA被瞧不起 你有什么建议? Drive Fast !

OceanBase Hybrid search 能力测试,平换MySQL的好选择

HyBrid Search 实现价值落地,从真实企业的需求角度分析 !不只谈技术!

一个IP地址访问两个PG实例,上演“一女嫁二夫”的戏码

OceanBase 光速快递 OB Cloud “MySQL” 给我,Thanks a lot

从“小偷”开始,不会从“强盗”结束 -- IvorySQL 2025 PostgreSQL 生态大会

被骂后的文字--技术人不脱离思维困局,终局是个 “死” ? ! ......

个群2025上半年总结,OB、PolarDB, DBdoctor、爱可生、pigsty、osyun、工作岗位等

卷呀卷,Hybrid 混合查询学习--哪个库是小趴菜

从MySQL不行了,到乙方DBA 给狗,狗都不干? 我干呀!

DBA 干不好容易蹲牢房--这事你知道吗?

SQL SERVER 2025发布了, China幸亏有信创!

MongoDB 麻烦专业点,不懂可以问,别这么用行吗 ! --TTL

P-MySQL SQL优化案例,反观MySQL不死没有天理

MySQL 条件下推与排序优化实例--MySQL8.035

云数据库厂商除了卷技术,下一个阶段还可以卷什么?

PostgreSQL 新版本就一定好--由培训现象让我做的实验

某数据库下的一手好棋!共享存储落子了!

删除数据“八扇屏” 之 锦门英豪 --我去-BigData!

PostgreSQL “乱弹” 从索引性能到开发优化

写了3750万字的我,在2000字的OB白皮书上了一课--记 《OceanBase 社区版在泛互场景的应用案例研究》

SQLSHIFT 是爱可生对OB的雪中送炭!

青春的记忆,MySQL 30年感谢有你,再见!(译)

老实人做的数据库产品,好像也不“老实” !

疯狂老DBA 和 年轻“网红” 程序员 --火星撞地球-- 谁也不是怂货

哈呀站,OB广州开发者大会 之 “五” 眼联盟

和架构师沟通那种“一坨”的系统,推荐只能是OceanBase,Why ?

OceanBase 相关文章

某数据库下的一手好棋!共享存储落子了!

写了3750万字的我,在2000字的OB白皮书上了一课--记 《OceanBase 社区版在泛互场景的应用案例研究》

哈呀站,OB广州开发者大会 之 “五” 眼联盟

OceanBase 单机版可以大批量快速部署吗? YES

OceanBase 6大学习法--OBCA视频学习总结第六章

OceanBase 6大学习法--OBCA视频学习总结第五章--索引与表设计

OceanBase 6大学习法--OBCA视频学习总结第五章--开发与库表设计

OceanBase 6大学习法--OBCA视频学习总结第四章 --数据库安装

OceanBase 6大学习法--OBCA视频学习总结第三章--数据库引擎

OceanBase 架构学习--OB上手视频学习总结第二章 (OBCA)

OceanBase 6大学习法--OB上手视频学习总结第一章

没有谁是垮掉的一代--记 第四届 OceanBase 数据库大赛

OceanBase 送祝福活动,礼物和幸运带给您

跟我学OceanBase4.0 --阅读白皮书 (OB分布式优化哪里了提高了速度)

跟我学OceanBase4.0 --阅读白皮书 (4.0优化的核心点是什么)

跟我学OceanBase4.0 --阅读白皮书 (0.5-4.0的架构与之前架构特点)

跟我学OceanBase4.0 --阅读白皮书 (旧的概念害死人呀,更新知识和理念)

聚焦SaaS类企业数据库选型(技术、成本、合规、地缘政治)

OceanBase 学习记录-- 建立MySQL租户,像用MySQL一样使用OB MongoDB 相关文章

MongoDB “升级项目” 大型连续剧(4)-- 与开发和架构沟通与扫尾

MongoDB “升级项目” 大型连续剧(3)-- 自动校对代码与注意事项

MongoDB “升级项目” 大型连续剧(2)-- 到底谁是"der"

MongoDB “升级项目” 大型连续剧(1)-- 可“生”可不升

MongoDB 大俗大雅,上来问分片真三俗 -- 4 分什么分

MongoDB 大俗大雅,高端知识讲“庸俗” --3 奇葩数据更新方法

MongoDB 学习建模与设计思路--统计数据更新案例

MongoDB 大俗大雅,高端的知识讲“通俗” -- 2 嵌套和引用

MongoDB 大俗大雅,高端的知识讲“低俗” -- 1 什么叫多模

MongoDB 合作考试报销活动 贴附属,MongoDB基础知识速通

MongoDB 年底活动,免费考试名额 7个公众号获得

MongoDB 使用网上妙招,直接DOWN机---清理表碎片导致的灾祸 (送书活动结束)

MongoDB 2023年度纽约 MongoDB 年度大会话题 -- MongoDB 数据模式与建模

MongoDB 双机热备那篇文章是 “毒”

MongoDB 会丢数据吗?在次补刀MongoDB 双机热备

MONGODB ---- Austindatabases 历年文章合集

PolarDB 已经开放的课程

PolarDB 非官方课程第八节--数据库弹性弹出一片未来--结课

PolarDB 非官方课程第七节--数据备份还原瞬间完成是怎么做到的--答题领奖品

PolarDB 非官方课程第六节--数据库归档还能这么玩--答题领奖品

PolarDB 非官方课程第五节--PolarDB代理很重要吗?--答题领奖品

PolarDB 非官方课程第四节--PG实时物化视图与行列数据整合处理--答题领奖品

PolarDB 非官方课程第三节--MySQL+IMCI=性能怪兽--答题领奖品

PolarDB 非官方课程第二节--云原生架构与特有功能---答题领奖品

PolarDB 非官方课程第一节-- 用户角度怎么看PolarDB --答题领奖品

免费PolarDB云原生课程,听课“争”礼品,重塑云上知识,提高专业能力

PolarDB 相关文章

数据压缩60%让“PostgreSQL” SQL运行更快,这不科学呀?

这个 PostgreSQL 让我有资本找老板要 鸡腿 鸭腿 !!

用MySQL 分区表脑子有水!从实例,业务,开发角度分析 PolarDB 使用不会像MySQL那么Low

P-MySQL SQL优化案例,反观MySQL不死没有天理

MySQL 和 PostgreSQL 可以一起快速发展,提供更多的功能?

这个MySQL说“云上自建的MySQL”都是”小垃圾“

PolarDB MySQL 加索引卡主的整体解决方案

“PostgreSQL” 高性能主从强一致读写分离,我行,你没戏!

PostgreSQL 的搅局者问世了,杀过来了!

在被厂商围剿的DBA 求生之路 --我是老油条

POLARDB 添加字段 “卡” 住---这锅Polar不背

PolarDB 版本差异分析--外人不知道的秘密(谁是绵羊,谁是怪兽)

在被厂商围剿的DBA 求生之路 --我是老油条

PolarDB 答题拿-- 飞刀总的书、同款卫衣、T恤,来自杭州的Package(活动结束了)

PolarDB for MySQL 三大核心之一POLARFS 今天扒开它--- 嘛是火

PostgreSQL 相关文章

说我PG Freezing Boom 讲的一般的那个同学专帖给你看这次可满意

一个IP地址访问两个PG实例,上演“一女嫁二夫”的戏码

PostgreSQL Hybrid能力岂非“小趴菜”数据库可比 ?

PostgreSQL 新版本就一定好--由培训现象让我做的实验

PostgreSQL “乱弹” 从索引性能到开发优化

PostgreSQL 无服务 Neon and Aurora 新技术下的新经济模式 (翻译)

PostgreSQL的"犄角旮旯"的参数捋一捋

PostgreSQL逻辑复制槽功能

PostgreSQL 扫盲贴 常用的监控分析脚本

“PostgreSQL” 高性能主从强一致读写分离,我行,你没戏!

PostgreSQL 添加索引导致崩溃,参数调整需谨慎--文档未必完全覆盖场景

PostgreSQL 的搅局者问世了,杀过来了!

PostgreSQL SQL优化用兵法,优化后提高 140倍速度

PostgreSQL 运维的难与“难” --上海PG大会主题记录

PostgreSQL 什么都能存,什么都能塞 --- 你能成熟一点吗?

PostgreSQL 迁移用户很简单 --- 我看你的好戏

PostgreSQL 用户胡作非为只能受着 --- 警告他

全世界都在“搞” PostgreSQL ,从Oracle 得到一个“馊主意”开始 PostgreSQL 加索引系统OOM 怨我了--- 不怨你怨谁

PostgreSQL “我怎么就连个数据库都不会建?” --- 你还真不会!

病毒攻击PostgreSQL暴力破解系统,防范加固系统方案(内附分析日志脚本)

PostgreSQL 远程管理越来越简单,6个自动化脚本开胃菜

PostgreSQL 稳定性平台 PG中文社区大会--杭州来去匆匆

PostgreSQL 如何通过工具来分析PG 内存泄露

PostgreSQL 分组查询可以不进行全表扫描吗?速度提高上千倍?

POSTGRESQL --Austindatabaes 历年文章整理

PostgreSQL 查询语句开发写不好是必然,不是PG的锅

PostgreSQL 字符集乌龙导致数据查询排序的问题,与 MySQL 稳定 "PG不稳定"

PostgreSQL Patroni 3.0 新功能规划 2023年 纽约PG 大会 (音译)

PostgreSQL 玩PG我们是认真的,vacuum 稳定性平台我们有了

PostgreSQL DBA硬扛 垃圾 “开发”,“架构师”,滥用PG 你们滚出 !(附送定期清理连接脚本)

DBA 失职导致 PostgreSQL 日志疯涨

MySQL相关文章

MySQL 条件下推与排序优化实例--MySQL8.035

青春的记忆,MySQL 30年感谢有你,再见!(译)

MySQL 8 SQL 优化两则 ---常见问题

MySQL SQL优化快速定位案例 与 优化思维导图

"DBA 是个der" 吵出MySQL主键问题多种解决方案

MySQL 怎么让自己更高级---从内存表说到了开发方式

MySQL timeout 参数可以让事务不完全回滚

MySQL 让你还用5.7 出事了吧,用着用着5.7崩了

MySQL 的SQL引擎很差吗?由一个同学提出问题引出的实验

用MySql不是MySQL, 不用MySQL都是MySQL 横批 哼哼哈哈啊啊

MYSQL --Austindatabases 历年文章合集

临时工访谈系列

没有谁是垮掉的一代--记 第四届 OceanBase 数据库大赛

ETL 行业也够卷,云化ETL,ETL 软件不过了

SQL SERVER 系列

SQL SERVER维保AI化,从一段小故事开始

SQL SERVER 如何实现UNDO REDO 和PostgreSQL 有近亲关系吗

SQL SERVER 危险中,标题不让发,进入看详情(译)

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-09-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AustinDatabases 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档