首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Dask distributed -创建工作者的指南

Dask distributed -创建工作者的指南
EN

Stack Overflow用户
提问于 2019-08-14 13:26:39
回答 1查看 57关注 0票数 1

我刚接触dask,在设置dask分布式集群时,我不确定这样做的最佳实践是什么。在设置工作进程时,让两个工作进程都有4 1GB的内存,还是让8个工作进程都有1 1GB的内存更有效率?它会根据要处理的数据而变化吗?我们有大约5-10 be的拼图格式的数据需要处理。你能建议一种常见的设置开始吗?另外,当工作线程的数量增加时,我们还需要增加调度器的内存吗?

EN

回答 1

Stack Overflow用户

发布于 2019-08-16 01:47:03

这将取决于您将执行的函数的类型。如果你的函数是纯Python的,那么最好是多个worker,否则会被Python的GIL阻塞执行。另一方面,如果您的函数主要使用释放GIL的代码,那么拥有具有多个线程的工作线程可能是有益的。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/57488592

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档