我需要帮助,因为我只是刚开始机器学习,我不知道下表中的k最近邻算法是否可以用来识别适合学生11的程序(S)。
学校的科目(数学、英语等)当“Program”列有A、B和C类标签时,二进制值代表了学生对这些学科的兴趣。K-NN算法能根据表中的二元变量找到相似的学生吗?

发布于 2018-08-01 19:53:35
喔,有一个更简单的方法来找到正确的程序,鉴于这五个分数。
样本空间为2^5 = 32 (就像一枚公平硬币的5次翻转)。其中每一个必须映射到程序A,因为32 > 3,可能的组合中有多个被映射到至少一个程序。
在其他条件相同的情况下,大多数程序都由大约10个组合映射。但是一定有一条规则把每一个组合和一个程序联系在一起,不是吗?
所以,您所需要的只是一个键,值哈希表。也许最简单的方法就是将主题连接成五个字母字符串('11011')作为键使用,这样Python中的最小字典看起来就像
sorting_hat = {'11011': 'C'}https://datascience.stackexchange.com/questions/36129
复制相似问题