我仍然是机器学习的初学者,今天我想用scikit做一个简单的测试,但是我没有达到我的预期。我创建了一个数据集,其中一列是自然数,另一列是数字是偶数还是奇数,我的意思是,只有0或1。然后我尝试了几种不同的算法,无法正确预测与数据集中不同的数字的输出。我的问题是:有哪些算法对此有用?我想举个例子,Logistic回归可以起作用,或者KNN分类器,我开始学习机器学习,并且对这个简单的东西不起作用感到非常失望。
诚挚的问候
发布于 2020-05-11 02:12:04
从根本上说,像logistic回归这样的线性模型永远不会奏效,因为它的假设对您的数据集来说根本不正确。它假定在每个输入中正负变化的概率(真的,日志概率)是线性变化的,但它与输入中的每个整数值交替。KNN的假设也不符合。对于每个整数,它的邻居有一个相反的分类。由于您的输入与它们的用法不匹配,这些应用在您的输入中将永远不能很好地工作。
但是,如果您将输入的奇偶性( model 2)作为一个功能,那么它们都应该学习这个模型。
这是一个很好的简单教训,在特性工程和理解假设时,您采取的应用算法。
https://datascience.stackexchange.com/questions/73950
复制相似问题