首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >当目标是将均值和方差最小化时,什么是好的奖励函数?

当目标是将均值和方差最小化时,什么是好的奖励函数?
EN

Data Science用户
提问于 2021-03-23 23:10:58
回答 1查看 30关注 0票数 1

我正试图提出一个问题,即尽量减少分配给不同用户的平均资源。由于环境的一些固有特性,一些用户很容易被最小化,而其他用户则很难做到这一点,这就产生了公平性问题。虽然主要的目标是最小化所有用户所消耗的平均资源,但我也希望确保分配是公平的,这样资源分配的差异就会更小。

那么,average+variance是一个合适的奖励函数吗?正确地说,我的意思是,它是否包含了我试图达到的目标--一个低平均水平,同时确保了某种程度的公平?我看到优化问题被描述为x*average + y*variance,其中有x+y=1。这种配方是否更适合我的情况呢?

EN

回答 1

Data Science用户

回答已采纳

发布于 2021-06-22 01:43:58

有几种可能的方法。

如果您真正关心的是方差,您可以采用贝叶斯方法将相关属性建模为分布。

听起来你并不真正关心方差,你想要的是不同群体的比例结果。这有时被称为均衡赔率。这可以通过后处理来创建一个校准的分类器分数,从而将输出标签更改为您想要的目标。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/91065

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档