首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何从大量的数据集中识别特定的特征?

如何从大量的数据集中识别特定的特征?
EN

Data Science用户
提问于 2020-09-16 07:45:30
回答 1查看 24关注 0票数 1

在机器学习中,我们需要处理任何类型的数据集。

在数据集中,有太多的记录和特性,一些数据集有很多特性(有时被称为columns__),

因此,数据科学家的主要问题是了解数据集的行为,并从数据集中获得有意义的见解,

让我们以Kaggle平台上的一个例子为例,有一个数据集用于预测房价,根据它的特性知道房价是多少,

下面是数据集房价预测--提前回归机学习问题的链接

因此,问题是如何从数据集中识别有意义的特征?

EN

回答 1

Data Science用户

回答已采纳

发布于 2020-09-16 08:11:57

我认为没有正确的方法,但你能做的是

  1. 如果您有许多功能,请使用PCA。这将根据每个特性的差异量减少一些特性。您可以使用其他降维技术。
  2. 您可以使用Lightgbm或随机森林之类的模型,并知道哪些功能是重要的。3.采用Lasso回归方法进行特征选择。
  3. 你可以用直觉来判断某些特性是否没有任何意义。

这些是理解重要特性的一些方法。您可以阅读本文:https://towardsdatascience.com/the-5-feature-selection-algorithms-every-data-scientist-need-to-know-3a6b566efd2

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/81786

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档