我最近开始读关于Docker的文章。
对我来说,在数据科学中,Docker是有用的,因为:
1)您有一个完全不同的环境,它保护您免受库和依赖关系问题的影响。
2)如果您的应用程序修改了公司的数据库,那么首先要确保代码工作正常,不会对数据库造成不良后果。因此,首先使用Docker测试代码。
我的问题:
发布于 2019-08-17 12:40:34
这两个原因都是关于虚拟环境和发展文化,它将发展和业务活动结合在一起。我宁愿使用术语“测试环境”而不是沙箱来描述这个函数。
Docker是一种有用的数据科学工具。其他原因可能包括,这有助于不同方之间的协作,因为每个人都在使用相同的映像(您在依赖项和库问题上的观点),并且它有助于与与其使用的操作系统无关的任何人共享和管理您的应用程序/代码/工作流。基本上,与第三方共享代码、与第三方管理代码以及用户对库依赖等方面的请求是有帮助的。
我不知道有趣的研究论文,但我认为这个问题有点类似于问,有一些有趣的研究论文,关于Python或R。
发布于 2019-08-18 09:32:10
使用码头群模式,您可以建立自己的低成本计算机安全集群。
(除了MOOC中的玩具例子外,我还没有亲自这么做。然而,这是一个关于星火在码头群,由其他人的博客从2019年4月开始。-请注意,群集模式曾经只适用于码头企业版,而不是免费社区版。现在文档不再这么说了,但我不确定)
发布于 2021-10-06 06:22:03
Docker是计算机程序员的解决方案,可以简化安装过程。它的基本前提是,当它在这台机器上工作时,它也应该为那些机器工作。在其他用户的系统中,使用的需求和库版本与在您的系统上使用的相同。Docker使用(可重用)层。用户不是在本地运行apt-get安装、pip安装和其他任务,而是将它们写入每个项目的每个Dockerfile中。学习的斜率很小(最多两天的努力),但好处是巨大的。
Docker是每一个计算机科学家(现在是数据科学家和分析学家)都会在他们的工具箱中拥有的技术。知道Docker现在变得多么直截了当和直观,没有理由不将它纳入您的软件开发生命周期。
https://datascience.stackexchange.com/questions/57720
复制相似问题