首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >数据科学码头

数据科学码头
EN

Data Science用户
提问于 2019-08-17 12:17:08
回答 3查看 300关注 0票数 7

我最近开始读关于Docker的文章。

对我来说,在数据科学中,Docker是有用的,因为:

1)您有一个完全不同的环境,它保护您免受库和依赖关系问题的影响。

2)如果您的应用程序修改了公司的数据库,那么首先要确保代码工作正常,不会对数据库造成不良后果。因此,首先使用Docker测试代码。

我的问题:

  • 我说得对吗?我说的第二个原因是关于沙拳吗?第一个原因和沙拳无关,对吧?
  • 为什么Docker在数据科学中有用,还有其他原因吗?
  • 在数据科学方面,我没有发现很多关于码头的有趣的研究论文。你认识一些有名的吗?
EN

回答 3

Data Science用户

发布于 2019-08-17 12:40:34

这两个原因都是关于虚拟环境和发展文化,它将发展和业务活动结合在一起。我宁愿使用术语“测试环境”而不是沙箱来描述这个函数。

Docker是一种有用的数据科学工具。其他原因可能包括,这有助于不同方之间的协作,因为每个人都在使用相同的映像(您在依赖项和库问题上的观点),并且它有助于与与其使用的操作系统无关的任何人共享和管理您的应用程序/代码/工作流。基本上,与第三方共享代码、与第三方管理代码以及用户对库依赖等方面的请求是有帮助的。

我不知道有趣的研究论文,但我认为这个问题有点类似于问,有一些有趣的研究论文,关于Python或R。

票数 1
EN

Data Science用户

发布于 2019-08-18 09:32:10

使用码头群模式,您可以建立自己的低成本计算机安全集群。

  • 因此,如果您对大型数据集的分布式处理感兴趣,Docker (或者可能是容器管理工具Kubernetes)可以作为在许多容器(和/或主机)上部署阿帕奇火花 (或类似软件)的基础,以便进行并行处理。
  • 如果您对数据流进行实时分析,根据当前的需求,您可以相对轻松地扩展集群,而无需从虚拟化技术供应商那里购买大量昂贵的网络设备或昂贵的管理软件。

(除了MOOC中的玩具例子外,我还没有亲自这么做。然而,这是一个关于星火在码头群,由其他人的博客从2019年4月开始。-请注意,群集模式曾经只适用于码头企业版,而不是免费社区版。现在文档不再这么说了,但我不确定)

票数 1
EN

Data Science用户

发布于 2021-10-06 06:22:03

Docker是计算机程序员的解决方案,可以简化安装过程。它的基本前提是,当它在这台机器上工作时,它也应该为那些机器工作。在其他用户的系统中,使用的需求和库版本与在您的系统上使用的相同。Docker使用(可重用)层。用户不是在本地运行apt-get安装、pip安装和其他任务,而是将它们写入每个项目的每个Dockerfile中。学习的斜率很小(最多两天的努力),但好处是巨大的。

Docker是每一个计算机科学家(现在是数据科学家和分析学家)都会在他们的工具箱中拥有的技术。知道Docker现在变得多么直截了当和直观,没有理由不将它纳入您的软件开发生命周期。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/57720

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档