我有以下数据:

我想解释一下有两个因素的“环境”和“大坝”之间的关系。正如你可能注意到的,蓝色的人口包括在红色的人口中。我可以应用逻辑回归吗?
发布于 2022-05-19 17:54:01
是。如果您有分类问题的数字特性,则可以应用逻辑回归。
然而,您不太可能看到这些数据的惊人结果。让我们来看看在逻辑回归中表现良好的经典示例虹膜数据集:

这个数据集运行良好,因为这些类很大程度上是线性可分。从本质上说,您可以在该图上画线来分隔类。Logistic回归能够正确地对大多数样本进行分类。
在数据的情况下,逻辑回归(以及所有其他分类方法)将在“重叠”区域中挣扎,因为您现有的特性根本无法提供足够的信息来正确识别该区域中的类。在这个地区之外,你应该还能看到一些成功。
最好的方法来回答是否逻辑回归将满足你的需要是运行一个实验。在您的培训数据上运行它,同时保留测试集,并检查保存的数据的性能。如果这样做能满足您的需要,那么您就可以继续了。否则,您可能需要探索其他特性,或者想出另一种方法来解决这个问题。
https://datascience.stackexchange.com/questions/111127
复制相似问题