在机器学习中,我们需要处理任何类型的数据集。
在数据集中,有太多的记录和特性,一些数据集有很多特性(有时被称为columns__),
因此,数据科学家的主要问题是了解数据集的行为,并从数据集中获得有意义的见解,
让我们以Kaggle平台上的一个例子为例,有一个数据集用于预测房价,根据它的特性知道房价是多少,
下面是数据集房价预测--提前回归机学习问题的链接
因此,问题是如何从数据集中识别有意义的特征?
发布于 2020-09-16 08:11:57
我认为没有正确的方法,但你能做的是
这些是理解重要特性的一些方法。您可以阅读本文:https://towardsdatascience.com/the-5-feature-selection-algorithms-every-data-scientist-need-to-know-3a6b566efd2
https://datascience.stackexchange.com/questions/81786
复制相似问题