如果我有预测变量,它是连续变量和范畴变量的混合物,而响应变量是连续的。
我应该采用什么方法?线性回归、logistic回归或k均值聚类。
例如,
反应变量:疾病发生概率(连续)预测变量:食物摄入量(分类),年龄(连续),运动频率(连续)
因此,基于3种机器学习模型的最佳方法是什么?
发布于 2021-09-26 11:46:24
通常您应该同时开发多个模型。正如“不免费午餐定理”所指出的,在建模之前,没有办法知道哪个模型会表现得更好。在实践中,你可以作出一些有教养的猜测,但没有必要仓促进行。
如果输出是连续的,则不应该使用逻辑回归之类的分类模型。虽然名称可能会混淆,逻辑回归只是线性回归和应用于输出的sigmoid函数,因此它可以输出类概率,并用于分类。
https://datascience.stackexchange.com/questions/102494
复制相似问题