我已经在Google Cloud Vertex AI(Auto ML)上训练和部署了一个自然语言模型,大约有50,000条记录数据。现在我有额外的大约3,000条记录数据。如何使用3,000个数据重新训练现有模型?或者我应该训练一个有53,000个数据的新模型?
发布于 2021-05-28 18:16:33
我认为不可能在任何经过训练的机器学习模型中加载新数据。不幸的是,如果您想要考虑新的数据,您将需要将它们全部训练在一起。
当您从头开始创建模型时,可能存在基于前一个模型的training the model,但在Cloud Vertex AI等黑盒应用程序中,客户无法访问模型背后的逻辑。
我推荐这个lecture提示,当新数据可用时,应该在什么时候训练模型。
此外,在一些产品中,例如AutoML Vision,存在一个用于resumable training的功能,允许您暂停和恢复大型数据集的模型训练。如果你有兴趣为顶点AI实现这个特性,我建议你打开一个Feature Request。
https://stackoverflow.com/questions/67716348
复制相似问题