我真的很困惑于组织google顶点Ai数据集和在GCP中训练autoML模型。有谁能帮我理解一下吗?
让我解释一下我有困惑的情景。
假设在顶点Ai“contract_delivery_02”中有25个文件的文本实体提取数据集。我有三个标签创建(DelIncoTerms,DelLocation和DelWindow),我已经培训了模型。效果很好。

现在,我还有10个文件要上传,我介绍了另外两个标签(DelPrice & DelDelivery)。
我的问题
发布于 2022-07-05 22:30:59
对于问题1,您不必再上传所有文件。在Dataset中,只需添加2新标签,然后上传额外的10个文件即可。

上传完后,您现在可以继续在新添加的文件上放置标签(在您的示例中,总共有10个文件),然后在ALL files (25 + 10)上分配新的标签。您可以通过双击UI中新添加的文本,然后分配必要的标签来做到这一点。

对于问题2,由于有新添加的标签和培训文本,有必要对整个autoML进行再培训,以获得更准确的模型和更好的结果质量。
有关更多细节,您可以参考本文本实体提取数据的准备和训练模式文档。
https://stackoverflow.com/questions/72821008
复制相似问题