我正在研究特性工具包,我有一个关于函数"remove_highly_correlated_features".In文档的问题:“我们假设,对于一对特性,由dfs生成的功能矩阵中更正确的特性是更复杂的特性”。在dfs中,如何计算功能的复杂性,然后对它们进行排序?为什么右边的特征更复杂?谢谢
发布于 2022-04-25 18:41:55
remove_highly_correlated_features将特性的深度(feature.get_depth())作为基本的复杂性度量,其思想是,通过将原语叠加在一起创建的特性更加复杂。DFS输出的特征按上升深度排序。
这只是复杂性的近似,在某些情况下,用户可能会选择不同的功能来选择。
https://stackoverflow.com/questions/71986121
复制相似问题