假设我有一本Juypter,我正在使用它来分析、可视化、测试等等在任意数据集上具有不同超参数的各种机器学习模型,或者我正在开发机器学习库和工具包,都是用Python编写的。我们还可以说,我想使用该数据集运行的一些计算需要一个功能强大的GPU,以便在合理的时间内完成(我猜功能是相对的,我指的是一台拥有1 RTX 3090或可能3080 ti的计算机)。
话虽如此,虽然有几个函数在计算上非常紧张(比如训练一个或多个具有超参数变化的模型),但我编写的大部分代码并不是这样。此外,我也正在计算我想要如何设计我的分析,解决错误,等等。
由于以上所述,我实际需要的(相对)昂贵的、功能强大的GPU所需的时间并不高,然而,在我看来,我找到的执行此任务的所有选项都涉及支付云VM或Juypter Server的费用,在这里,我要为VM/服务器“运行”的所有时间付费,这包括了很多时候,我只是在编辑代码、调试代码或运行代码,而我可以在当前的笔记本上轻松地运行这些代码。
我认为解决我的问题的最好办法是做两件事中的一件:
我不得不想象,我不是第一个需要这样做的低成本机器学习工程师,所以我希望有资源来完成我在一般意义上正在寻找的东西,不管这是我上面列出的两种选择之一,还是一种同样简单易用和负担得起的选择。
另外,我不认为这些因素会有什么不同,但为了给出一些个性化的细节,我的家庭机器使用Mac,我非常喜欢使用NVIDIA gpus,而且我是一名大学生(如果这在某个地方有折扣的话)。
我只是想先发制人地回答我过去的一些问题:
发布于 2021-12-24 08:02:49
我也在一艘类似的船上(虽然我没有开发算法/库,只是在一些数据集中运行DL模型)。我的笔记本电脑没有GPU,DL需要GPU。所以我所做的就是使用免费的GPU,比如Google Colab,Kaggle笔记本,Paperspace来运行我的模型。
我的大部分时间都花在EDA和特性工程上,这不需要GPU。因此,当我执行这些任务时,我会在我使用的平台上关闭GPU。当我真的想训练我的模型或调整惠普,我只是打开GPU。此设施由您正在使用的平台提供。所以基本上我是免费运行DL模型的。
虽然这些平台提供的GPU并不是那么快,但对于大多数人来说,只要你不使用大数据,它们就足够了。
如果你真的需要更快的东西,你可以购买Google的订阅(每月10美元)。我不知道你会得到什么样的GPU,但它会比免费版本快得多。
另一个可行的选择是在Azure租一个VM。对于不需要GPU的部分,您可以在本地机器中执行,而对于需要GPU的部分,只能在VM中执行。例如,EDA、特性工程、特性选择等,所有这些步骤都可以在本地机器上完成,而实际的培训和HP调优可以在VM上完成。希望能帮上忙!
https://datascience.stackexchange.com/questions/106381
复制相似问题