我正试图决定哪种特定的算法最适合我的用例。
我有一个城市大约1000个实体建筑的数据集,包括位置、距离、年份和其他特征等。对于每一个新的数据点,一个建筑物,我想根据特征空间的比较找到3到5个最相似的建筑。
我把相似性定义为特征的加权比较。我想迭代整个特征空间(w/ filter类似的位置),并选择3-5最相似的建筑匹配新的建筑数据点。
以下是我的数据:

我想知道什么相似性度量会有意义?我在python工作,所以更喜欢用pythonic/sci来学习这种方法。
https://datascience.stackexchange.com/questions/77155
复制相似问题