文章/答案/技术大牛

发布

社区首页 >问答首页 >如何从大量的数据集中识别特定的特征？

问如何从大量的数据集中识别特定的特征？
EN

Data Science用户

提问于 2020-09-16 07:45:30

回答 1查看 24关注 0票数 1

在机器学习中，我们需要处理任何类型的数据集。

在数据集中，有太多的记录和特性，一些数据集有很多特性(有时被称为columns__)，

因此，数据科学家的主要问题是了解数据集的行为，并从数据集中获得有意义的见解，

让我们以Kaggle平台上的一个例子为例，有一个数据集用于预测房价，根据它的特性知道房价是多少，

下面是数据集房价预测--提前回归机学习问题的链接

因此，问题是如何从数据集中识别有意义的特征？

dataset

pandas

feature-selection

data-cleaning

data-analysis

回答 1

Data Science用户

回答已采纳

发布于 2020-09-16 08:11:57

我认为没有正确的方法，但你能做的是

如果您有许多功能，请使用PCA。这将根据每个特性的差异量减少一些特性。您可以使用其他降维技术。
您可以使用Lightgbm或随机森林之类的模型，并知道哪些功能是重要的。3.采用Lasso回归方法进行特征选择。
你可以用直觉来判断某些特性是否没有任何意义。

这些是理解重要特性的一些方法。您可以阅读本文：https://towardsdatascience.com/the-5-feature-selection-algorithms-every-data-scientist-need-to-know-3a6b566efd2

票数 1

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/81786

复制

相似问题

问如何从大量的数据集中识别特定的特征？
EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何从大量的数据集中识别特定的特征？EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何从大量的数据集中识别特定的特征？
EN