首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何利用成本矩阵获得再平衡策略?

如何利用成本矩阵获得再平衡策略?
EN

Data Science用户
提问于 2019-04-25 13:48:22
回答 1查看 176关注 0票数 0

对于使用成本矩阵最大限度地提高模型性能的分类问题,通常采用再平衡技术。

比方说,我有以下两个类的成本。

代码语言:javascript
复制
C(a,a) = 0, C(b,b) = 0, C(a,b) = 2, C(b,a) = 1.

然后,使用再平衡技术,我需要b类的例子和a类的例子的两倍。

但是,当(a,a)或(b,b)有成本时,再平衡战略应该是什么?

例如,

代码语言:javascript
复制
C(a,a) = 0, C(b,b) = 2, C(a,b) = -2, C(b,a) = -10

我该怎么处理这些案子?

EN

回答 1

Data Science用户

发布于 2019-04-25 15:08:12

在与正确答案C(b,b)相关联的情况下(在您的示例中),查找成本函数并不常见。

但如果有,我认为分类的解决方案可能是微不足道的:我可以说“我所有的预测都是'b'”,这样,我就可以把-10作为一种成本很多次,从而给我一个负成本(当然,取决于平衡)。

我不知道你提到的应用成本的技术(相应地重新平衡),但对我来说,如果目标函数发生变化以考虑到这一点,那就更自然了。

下面的文章讨论了解决这一问题的可能性(而不是重新平衡,我们应该度量成本敏感矩阵)。还有XGBoost!

据我所知,XGBoost分类的成本函数可以是个性化的。

成本敏感分类

XGBoost变化损失函数-- DS中的一个相关问题

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/50912

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档