首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >理解FeatureUnions (熊猫)工作的困惑

理解FeatureUnions (熊猫)工作的困惑
EN

Stack Overflow用户
提问于 2018-10-04 19:38:58
回答 1查看 1.4K关注 0票数 2

我正在学习熊猫的管道和特色联盟。我了解管道的工作原理,这有助于将一系列转换应用于给定的数据集。但是,我对功能联盟感到困惑。我读过文档,它说变压器是并行应用的,然后将结果连在一起。

我对此表示怀疑,如果我们将所有变压器应用于整个数据集,还是仅将不同的变压器应用于选定的功能?如果对整个数据集,我们如何连接结果?此外,我是否应该使用FeatureUnion的通用用例?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-10-05 12:49:50

当您想要对这些特性应用不同类型的转换时,就会使用FeatureUnion。对于同一组特性,您可能希望应用多种类型的转换,并希望将所有这些转换的组合用作您的新功能。

这里的文件中的解释应该会给你一些想法。

我认为在阅读了当前版本的文档之后,您会感到困惑。以前,FeatureUnion用来做ColumnTransformer在0.20版中正在做的事情。比较一下这里的最新示例:

  • transformer.html

下面是上一个版本的文档:

  • union.html

你会注意到相似之处。

您可以尝试在Stackoverflow上搜索以找到不同的FeatureUnion用例。如果仍然不满意,请随时提出更具体的问题。了解您想要对数据集做什么可能会有帮助。

注释更新

特征的数量可能增加或减少。如果您不将原始特性保存在转换中,FeatureUnion将不会保留它们。

举个例子:

代码语言:javascript
复制
estimators = [('linear_pca', PCA(n_components=5)), 
              ('kernel_pca', KernelPCA(n_components=10))]
combined = FeatureUnion(estimators)

假设您的原始数据有100个功能。上面的FeatureUnion将只返回15个新特性。

  • PCA将获得您所有的100个功能,并将它们转换为只保留5个组件,这些组件将返回给FeatureUnion。
  • 类似地,KernelPCA还将获得所有100个特性,并将10个组件保存在转换后的数据中。
  • 然后,FeatureUnion将将这5和10个特性连接起来,以返回15个新特性。
票数 7
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/52653993

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档