我正在使用Python、scikit-learn、keras和450x540 rgb正面手表的图像(例如观看_1、观看_2)。
我的目标是运行一个自动编码器或暹罗神经网络,以找到其中最相似的手表。然而,我不确定我是否会得到更好的结果,通过比较对的图像或三胞胎的图像。正如本研究论文中所定义的那样,三重奏图像由一个目标图像、一个与目标图像(更多)相似的图像和一个与目标图像不相似的图像组成。
有人能简单地解释一下为什么像前一篇论文所说的那样,使用三胞胎的图像会(必然)比使用对图像产生更好的结果吗?
发布于 2021-07-31 15:30:11
当正确和不正确的定义有明确的定义时,损失函数工作得最好。如果一切都是正确的,就没有训练的信号。这意味着训练的结束。损失函数需要加权误差才能使损失最小化。在图像相似性的情况下,加权误差是不同图像之间的距离。
图像三重奏比仅仅图像对包含更多用于训练丢失函数的信号,因此更有用。
https://datascience.stackexchange.com/questions/28231
相似问题