我们试图建立一个基于图像的产品搜索,我们的网站使用顶点ai图像分类模型(单标签)。
目前,我们有大约20k的产品与xx图像每种产品。因此,我们的数据集包含20k的标签(每个产品编号一个),但是在导入时我们会收到以下错误消息:
There are too many AnnotationSpecs in the dataset. Up to 5000 AnnotationSpecs are allowed in one Dataset. Check your csv/jsonl format with our public documentation.
看起来每个数据集不允许超过5000个标签.这个配额在文档中是不可见的--或者我们没有找到。
不管怎样,我们有什么办法让它运作吗?我们是否必须用5个不同的端点构建5个数据集,而不是查询每个端点以进行匹配?
发布于 2022-07-20 12:31:17
您可以在AutoML配额和限制文档中找到这些限制。
可以为一组产品建立多个模型--甚至类似的东西:一个初始模型来分类产品类别(珠宝、手表、鞋子、玩具等),第二步用于特定型号(识别特定产品属于玩具,或属于鞋,等等)。但老实说,这似乎有点难以支持--但肯定值得一试。
第二个选择是培训定制模型,您可以在其中对一些较大的模型进行微调(即。20k+,resnet,等等)确实知道所有的类(产品)。它一开始可以增加一些工作,但在建立之后,它将成为一个单一的推理模型,使用MLOps机制进行再训练将更加简单。(顶点管道)
https://stackoverflow.com/questions/73047696
复制相似问题