这个问题与这一个有关。
我正在使用米尔弗斯对大约100万张图像的数据集进行图像相似性研究。
当我插入一个图像时,Milvus返回一个id,它是milvus数据库(mysql)中该图像的id。当Milvus进行一项研究时,它会返回最相似图像的id。
现在,我必须跟踪"id ->图像名“的关系,以便在进行研究时能够显示正确的图像。
在提供的示例中所做的是将该关系存储在本地字典中(或使用类似于磁盘缓存的包)。
这是很好的工作,当训练是在同一台机器上进行的研究。
我想在一台机器上训练,然后在另一台机器上进行推理。
我的第一个想法是将关系"id->name“存储在与milvus的其他部分相同的mysql上的一个单独的表中。
这是个好主意吗这将在研究之后再花费一次mysql请求。
我能在milvus的表" id ->vector“和我的表" name ->id”之间连接mysql吗?这样milvus就可以在图像名的同时返回它的图像id了吗?
发布于 2020-11-24 02:26:18
在mysql上存储"id->name“关系是个好主意。
但是我不建议使用mysql来存储"id-> vector“关系,因为向量数据通常很大,占用更多的空间。
顺便说一句,使用诸如磁盘缓存之类的包来存储关系"id->name“也是一个不错的选择。因为这很合情合理。
https://stackoverflow.com/questions/64941015
复制相似问题