首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Pymongo parallel_scan

Pymongo parallel_scan
EN

Stack Overflow用户
提问于 2016-07-06 15:52:48
回答 0查看 1.3K关注 0票数 1

我需要从一个非常大的集合中读取,并对每个文档执行一些操作。

我正在使用pymongo的parallel_scan在许多进程上执行这些操作,以提高效率。

代码语言:javascript
复制
cursors = mongo_collection.parallel_scan(6)

if __name__ == '__main__':
    processes = [multiprocessing.Process(target=process_cursor, args=(cursor,)) for cursor in cursors]

虽然使用这些游标的进程按预期启动并开始运行,但所有进程都完成了各自的部分并退出,最后只有一个进程长时间保持运行。

看起来这是因为parallel_scan没有在游标中平均分配文档。如何使所有游标的文档数几乎相等。

EN

回答

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/38218852

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档