当我开始理解这个算法时,我不太明白它应该如何工作。我有一个数据集,我有需要分类的新数据。数据集:
2 2 a
3 5 a
1 8 b
3 16 b
4 12 a
5 20 a以及一项新的数据:
1 2现在我需要将新的集合分类为"a“或"b”。我可以为每一组计算距离,为每个数据集计算sqrt((aNew-Ai)^2+(bNew-Bi)^2)。我有这个数据:
a b dist class
new 1 2 ? ?
old 2 2 1,0 a
old 3 5 5,8 a
old 1 8 8,1 b
old 3 16 16,3 b
old 4 12 12,6 a
old 5 20 20,6 a也是为了前任。K等于6。我应该如何分类我的新数据?
发布于 2018-05-06 11:30:44
发布于 2018-05-04 16:52:25
在您的示例中,它是a,因为它是k (6)最近邻列表中最常见的值。
但是K应该是一个不均匀的数字,以防止模糊的分类。
https://stackoverflow.com/questions/50133901
复制相似问题