首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >基于云GPU的高效机器学习开发

基于云GPU的高效机器学习开发
EN

Data Science用户
提问于 2021-12-24 06:12:36
回答 1查看 68关注 0票数 0

假设我有一本Juypter,我正在使用它来分析、可视化、测试等等在任意数据集上具有不同超参数的各种机器学习模型,或者我正在开发机器学习库和工具包,都是用Python编写的。我们还可以说,我想使用该数据集运行的一些计算需要一个功能强大的GPU,以便在合理的时间内完成(我猜功能是相对的,我指的是一台拥有1 RTX 3090或可能3080 ti的计算机)。

话虽如此,虽然有几个函数在计算上非常紧张(比如训练一个或多个具有超参数变化的模型),但我编写的大部分代码并不是这样。此外,我也正在计算我想要如何设计我的分析,解决错误,等等。

由于以上所述,我实际需要的(相对)昂贵的、功能强大的GPU所需的时间并不高,然而,在我看来,我找到的执行此任务的所有选项都涉及支付云VM或Juypter Server的费用,在这里,我要为VM/服务器“运行”的所有时间付费,这包括了很多时候,我只是在编辑代码、调试代码或运行代码,而我可以在当前的笔记本上轻松地运行这些代码。

我认为解决我的问题的最好办法是做两件事中的一件:

  1. 找一个我只为计算时间付费的服务。所以当我编辑我的代码、思考等时,我不会为我没有花费大量计算资源的所有时间付费(或者至少我不付很多钱,我不介意支付大约每小时10美分左右的少量空闲时间费用)。
  2. 找到一个服务,让我可以在我的家用机器上运行代码和完全开发,但是当我需要得到计算密集型函数的结果时,我使用的是类似于Google函数的东西,在那里我基本上只能运行云中的一个函数。这可以用来在云GPU中的给定数据集上运行一个CUML训练算法,然后我可以在我的主机上分析结果,而无需支付云提供商的费用。这不是我能找到的使用GPU的东西。

我不得不想象,我不是第一个需要这样做的低成本机器学习工程师,所以我希望有资源来完成我在一般意义上正在寻找的东西,不管这是我上面列出的两种选择之一,还是一种同样简单易用和负担得起的选择。

另外,我不认为这些因素会有什么不同,但为了给出一些个性化的细节,我的家庭机器使用Mac,我非常喜欢使用NVIDIA gpus,而且我是一名大学生(如果这在某个地方有折扣的话)。

备注:

我只是想先发制人地回答我过去的一些问题:

  1. 我不能仅仅在我的主机上开发我的代码,然后在远程机器上运行它,因为我需要能够在调试循环中使用GPU。
  2. 我不能仅仅通过在我仍在调试/编辑的阶段使用较小的数据集来解决我的计算需求的“缩小”,因为即使我使用较小的数据集进行调试,我仍然需要一个GPU来运行我的代码,而我的主机没有GPU。
EN

回答 1

Data Science用户

发布于 2021-12-24 08:02:49

我也在一艘类似的船上(虽然我没有开发算法/库,只是在一些数据集中运行DL模型)。我的笔记本电脑没有GPU,DL需要GPU。所以我所做的就是使用免费的GPU,比如Google Colab,Kaggle笔记本,Paperspace来运行我的模型。

我的大部分时间都花在EDA和特性工程上,这不需要GPU。因此,当我执行这些任务时,我会在我使用的平台上关闭GPU。当我真的想训练我的模型或调整惠普,我只是打开GPU。此设施由您正在使用的平台提供。所以基本上我是免费运行DL模型的。

虽然这些平台提供的GPU并不是那么快,但对于大多数人来说,只要你不使用大数据,它们就足够了。

如果你真的需要更快的东西,你可以购买Google的订阅(每月10美元)。我不知道你会得到什么样的GPU,但它会比免费版本快得多。

另一个可行的选择是在Azure租一个VM。对于不需要GPU的部分,您可以在本地机器中执行,而对于需要GPU的部分,只能在VM中执行。例如,EDA、特性工程、特性选择等,所有这些步骤都可以在本地机器上完成,而实际的培训和HP调优可以在VM上完成。希望能帮上忙!

Cheers!

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/106381

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档