我无法找到如何在lightgbm纸中构造bin映射的详细描述。我有几个关于bin映射的问题。
发布于 2019-01-14 15:10:16
1:回收箱是预处理的一种形式:在优化之前,每个变量都被转换成离散值。它是特定于您的培训数据,不改变。
2:有一个参数可以调优,以设置bin的最大数量。当然,如果您的功能只有5个不同的值,那么只有5个回收箱。因此,每个功能都可以有不同数量的回收箱。
3:垃圾桶的分割点不是按等宽选择的,而是按频率选择的:如果你设置了100个垃圾箱,就会选择分裂点,因为每个垃圾箱包含大约1%的训练点数(如果你有相同的值,它可能或多或少是不同的)。这个过程类似于熊猫切函数。
希望我已经回答了你的问题。
https://stackoverflow.com/questions/54183900
复制相似问题