我正在跟踪这个文档页面,以了解SageMaker的分布式培训功能。
上面写着:-
SageMaker分布式培训库只能通过TensorFlow、PyTorch和HuggingFace框架的AWS深度学习容器在SageMaker培训平台中使用。
这是否意味着我们不能使用SageMaker分布式训练来使用传统的机器学习算法(如线性回归、随机森林或XGBoost )来训练机器学习模型?
我有一个用例,其中数据集非常大,和分布式培训可以帮助模型并行和数据并行。为了避免在训练实例的内存中输入大量数据,还可以推荐哪些其他选项?
发布于 2022-09-18 07:20:25
SageMaker培训提供各种表格内置算法。、KNN、XGBoost和线性学习器以及分解机器算法都是可并行的(可以在多个设备上运行),并且支持数据流(没有数据大小的限制)。
除了内置算法之外,SageMaker还支持自己的培训脚本。
https://stackoverflow.com/questions/73752051
复制相似问题