如果我有3个嵌入Anchor, Positive, Negative从一个暹罗模型训练欧几里得距离作为三重子损失的距离度量。
我注意到,如果用A,P,N模型计算欧氏距离,结果在大多数情况下似乎与匹配图像的距离变小,而非匹配图像的距离更大是一致的。
如果我在上面的嵌入中使用余弦相似性,我无法区分(A, P)和(A, N)之间的相似值,或者对于不同的图像,一个值似乎更高,反之亦然。
三胞胎是随机选择的,没有在线硬,半硬挖掘。
想知道我在实现中是否犯了错误,或者推理时间中的距离函数应该是相同的。
发布于 2022-02-21 14:09:02
推理时使用的距离函数应与训练时使用的距离函数相同。距离函数将影响嵌入的学习方式,在推理时确定相似度将使用相同的嵌入空间。
如果你认为余弦嵌入损耗能比欧几里得距离更好地代表你的数据,你可以用它来训练你的网络。
发布于 2022-02-21 16:38:41
余弦距离不是真正的度量,它违反了不可分辨的恒等式,因为余弦距离不太关心所讨论的向量的大小。
余弦距离比欧氏距离具有更强的可解释性,因为余弦在[-1,1]上是有界的,但需要谨慎应用。
https://datascience.stackexchange.com/questions/108231
复制相似问题