我目前正在做一个项目,在这个项目中,我需要量化算法之间的相似性--也就是说,我有几十种用于相同目的的算法,我想量化哪些算法与其他算法最接近(即更相似),哪些是真正的“新奇”。
我的Google-Fu和SO-Jutsu都让我失望了,所以如果有人能说明这一点,我将不胜感激。这样的指标是否存在呢?
发布于 2015-11-08 09:16:28
作为相似性的一种度量,您可以创建n数据集,然后在所有这些数据集上运行您的每个算法。然后,您将获得与每个算法相关联的运行时的n-dimensional向量,然后您可以在其上添加任何旧距离。我想像余弦距离这样的东西会是一个很好的首选,因为如果你的数据集是不同大小的,你会根据它们的规模对你的算法进行分类。除了运行时之外,您还可以监视最大内存使用率或您能想到的任何其他测量方法。
https://stackoverflow.com/questions/33589594
复制相似问题