文章/答案/技术大牛

发布

社区首页 >问答首页 >将机器学习算法并行化作为PhD研究的一部分是否有意义？

问将机器学习算法并行化作为PhD研究的一部分是否有意义？
EN

Data Science用户

提问于 2018-01-31 13:36:06

回答 1查看 115关注 0票数 1

我正在开发机器学习算法来帮助我的PhD的各种癌症的诊断和预后。我的实验室是Nvidia教学中心(CUDA)。

我的主管认为我也需要通过在CUDA中并行化来优化ML。然而，在我看来，一个模型是一次培训，没有必要再进行培训。测试模型也不费时。我的兴趣是ML，而不是并行处理。

( 1)我是否应该花大量时间与数据自动化系统并行？

2)数据自动化系统是否仍然是一个可行的研究框架？

3)在研究之外的世界里，这会不会使获得一份ML工作更容易呢？

nvidia

machine-learning

research

回答 1

Data Science用户

回答已采纳

发布于 2018-01-31 16:30:30

从练习的角度来看，只是分享一些想法。我没有任何研究(PhD)类型的经验，你的主管可能会传达类似的内容如下。

并且，在这里并行计算，我个人定义为单一PC，它使用图形卡GPU核来计算加速，而不是聚类计算。

的一些理论思考

有时，在ML世界中，需要在相同的数据上多次构建多个模型，甚至是相同的模型。

这个例子应该是：

使用交叉验证(同一方法多次)具有稳健的模型输出或参数。或
多个弱学习者(多个模型)的模型集成具有较好的精度。

这些ML过程是耗时的，并行可以帮助减少时间。

此外，从提供的信息，我假设您的ML项目是图像识别与GPU加速。但我不知道这个项目的主要目的是什么。它可以是发展/改进新的ML方法，或比较已知的ML方法，形成一个学术评论。不管是什么情况，我想，结果仍然应该达到一定的准确性水平。

因此，有必要考虑一些有效的方法(例如并行计算)来加速建模过程。

一些实际的考虑事项

在实践中，效率是非常重要的。当你有一个理论上准确的模型，但需要很长时间来构建模型，它将是不可接受的。

你可以退一步说，让我们回到一些简单的、快速的、精度较低的模型。但是，当传统方法具有相似或更好的准确性时，ML又有什么意义呢？

对

问题的个人回答

( 1)我是否应该花大量时间与数据自动化系统并行？并行化有助于提高ML训练的速度。而CUDA是学习和应用于ML的一种很酷的技术。只需平衡项目的主要目的和时间之间的时间。

2)数据自动化系统是否仍然是一个可行的研究框架？这是你的报告/论文/论文的第一章。至少，越来越多的ML使用深入学习，这可以更快涉及GPU。

3)在研究之外的世界里，这会不会使获得一份ML工作更容易呢？我不能肯定地说，知道CUDA/并行会使你成为顶级球员(因为其他方面也会被考虑)。但当其他候选人有类似的背景时，有类似计算经验的候选人就会脱颖而出。

票数 1

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/27296

复制

相似问题

问将机器学习算法并行化作为PhD研究的一部分是否有意义？
EN

回答 1

Data Science用户

的一些理论思考

一些实际的考虑事项

对

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问将机器学习算法并行化作为PhD研究的一部分是否有意义？EN

回答 1

Data Science用户

的一些理论思考

一些实际的考虑事项

对

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问将机器学习算法并行化作为PhD研究的一部分是否有意义？
EN