在AutoML模型的GCP Vertex AI中尝试批量预测时,批量预测结果跨越多个文件(从用户角度来看,这并不方便)。如果它是单个批次预测结果文件,即在单个文件中涵盖所有记录,则会使过程变得更加简单。
例如,我的输入数据集文件中有5585条记录。批量预测结果由21个文件组成,每个文件具有200-300范围内的记录,因此总共覆盖5585条记录。
发布于 2021-10-24 14:18:01
对图像、文本、视频、表格AutoML模型进行批量预测,使用分布式处理运行作业,这意味着数据分布在任意虚拟机群集中,并以不可预测的顺序进行处理,因此您将获得存储在云存储中的各种文件的预测结果。由于批处理预测输出文件的生成顺序与输入文件的顺序不同,因此提出了一个功能请求,您可以从此link跟踪此请求的更新。
我们目前无法提供预计到达时间,但您可以跟踪问题跟踪器中的进度,您可以通过参考此link来“启动”问题以接收自动更新并给它以牵引力。
但是,如果要对tabular AutoML model进行批处理预测,则可以选择BigQuery作为存储,所有预测输出将存储在单个表中,然后可以将表数据导出到单个CSV文件。
https://stackoverflow.com/questions/69689785
复制相似问题