我有一组查询分类任务使用梯度提升分类器的学习。我想通过添加附加特性和GloVe来丰富模型。在这种情况下,我应该如何处理缩放?GloVe已经有了很好的规模,但是特性却不是这样。
我尝试过StandardScaler,但是与仅仅使用GloVe相比,这降低了性能。问题可能与功能本身,然而,我需要你的意见,在缩放星型的情况下手套和虚拟变量。
发布于 2020-07-27 22:20:53
我的第一个评论是,您必须记住,基于树的模型对规模不敏感,因此缩放不应影响模型的性能,因此正如您很好地提到的,它应该是与特性本身有关的问题。
如果您想缩放您的所有功能,您可以使用MinMaxScaler和min和max值,作为手套向量的min和max,以便所有功能都在相同的比例上。
https://datascience.stackexchange.com/questions/78380
复制相似问题