我为机器学习创建了我的样本数据,只是为了检查分类和回归模型是如何工作的。
我的示例数据有50行,列为Memory、CPU、Responsetime。我使用公式Responsetime生成了Memory*2 + CPU*0.7。
现在,当我利用这些数据用不同的算法(如DecisionTree、RandomForest、SVM、NaiveBayes、SGD、LogisticRegression )生成分类模型时,我从模型中得到kappa和相关系数(model.coef_),并在决策树、随机森林的情况下获得特征重要性。
Memory和CPU返回的系数值与我用来生成这些响应时间值的公式不太接近。在这种情况下,我无法理解我生成的模型是否正确用于预测。
对于回归,线性回归给了我正确的系数与我的公式匹配。
发布于 2017-05-16 19:49:33
您给出了一个线性公式:(Memory*2 + CPU*0.7)和线性回归,这是一种在y_i = B_0*1 + B_1*X_i_1 + ... + B_n*X_i_n中学习B_j值的方法,能够用您期望的系数来建模。这是因为线性回归模型的形式与方程的形式相匹配,所以直接匹配系数是有意义的。
对于你的分类算法,不仅方程的形式不匹配你的线性方程,而且这个问题也不是一个真正的分类问题。你已经给出了一个明显是回归问题的例子。
https://stackoverflow.com/questions/44010201
复制相似问题