首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用查询的mongodb 'count‘非常慢

使用查询的mongodb 'count‘非常慢
EN

Stack Overflow用户
提问于 2013-09-28 05:58:27
回答 2查看 5.4K关注 0票数 10

每个人,im都使用MongoDB2.4.6版本,在windows 2008中使用64位。

我有一个有200万条记录的集合,需要在客户端中搜索和分页。

代码语言:javascript
复制
db.products.find({"catalogs":1205}).skip().limit() is very fast .

但在计算记录总数时:

代码语言:javascript
复制
db.products.find({"catalogs":1205},{"_id":1}).count() is too slow.

>> 442312 records.

>>[log] Sat Sep 28 00:20:01.566 [conn10] command products.$cmd command: { count: "products", query: { catalogs: 1205.0 }, fields: { _id: 1.0 } } ntoreturn:1 keyUpdates:0 locks(micros) r:460681 reslen:48 460ms

这个计数命令经过的时间是460ms,太slow.if了,我们有很多请求,那很糟糕。

我为一个“目录”字段创建了一个索引,并且不能使用$inc命令,因为查询可能非常复杂。

我在谷歌上搜索了一些类似的问题,发现MongoDB2.4版本中已经修复了这个“计数”性能错误。

来自http://docs.mongodb.org/manual/release-notes/2.4-overview/

代码语言:javascript
复制
Improvements to count provide dramatically faster count operations. Counting is now up to 20 times faster for low cardinality index based counts.

有什么方法可以提高计数?谢谢。

更新一些信息

代码语言:javascript
复制
> db.products.getIndexes()
[
    {
            "v" : 1,
            "key" : {
                    "_id" : 1
            },
            "ns" : "products.products",
            "name" : "_id_"
    },
    {
            "v" : 1,
            "key" : {
                    "catalogs" : 1,
                    "created" : -1
            },
            "ns" : "products.products",
            "name" : "catalogs_1_created_-1"
    }
]

查询和经过的时间:

代码语言:javascript
复制
>db.products.find({"catalogs":1205},{"_id":1}).limit(20)
>>Tue Oct 01 15:39:19.160 [conn2] query products.products query: { catalogs: 1205.0 } cursorid:277334670708253 ntoreturn:20 ntoskip:0 nscanned:21 keyUpdates:0 locks(micros) W:5045 r:1017 nreturned:20 reslen:704 1ms

查询exaplin:

代码语言:javascript
复制
>db.products.find({"catalogs":1205},{"_id":1}).explain()

{
    "cursor" : "BtreeCursor catalogs_1_created_-1",
    "isMultiKey" : true,
    "n" : 451466,
    "nscannedObjects" : 451466,
    "nscanned" : 451466,
    "nscannedObjectsAllPlans" : 451466,
    "nscannedAllPlans" : 451466,
    "scanAndOrder" : false,
    "indexOnly" : false,
    "nYields" : 2,
    "nChunkSkips" : 0,
    "millis" : 2969,
    "indexBounds" : {
            "catalogs" : [
                    [
                            1205,
                            1205
                    ]
            ],
            "created" : [
                    [
                            {
                                    "$maxElement" : 1
                            },
                            {
                                    "$minElement" : 1
                            }
                    ]
            ]
    },
    "server" : "WIN-O47CO6C2WXY:27017"

}

EN

回答 2

Stack Overflow用户

发布于 2014-07-06 01:30:56

这个计数查询不是特别快的原因是它必须扫描索引中的451466个条目才能计数条目。换句话说,相对于满足查询的条目的索引和大小,查询不是很有选择性。

票数 1
EN

Stack Overflow用户

发布于 2015-08-17 04:51:55

在进行计数之前,count()会遍历游标中的所有结果,这就是为什么计算速度如此缓慢的原因。相反,使用size(),相对于count(),它的速度相当快。

票数 -2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/19063843

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档