首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >加权博弈结果的公式/算法

加权博弈结果的公式/算法
EN

Stack Overflow用户
提问于 2010-10-07 08:33:08
回答 3查看 536关注 0票数 2

我有一个有趣的概念问题,我想知道是否有人能帮我量化它。基本上,我在玩一套游戏.对于每一场比赛,我都知道我赢的概率,我会打成平局的概率,以及我输的概率(每场比赛都有不同的概率)。

在高层次上,我想知道的是:我应该把注意力集中在哪些游戏上?例如,我不会把任何精力投入到我有0%获胜机会的游戏中(或者我有100%获胜机会的游戏)。但是对于一场50/50的比赛,我会非常关心,并且想要付出最大的努力。如果没有关系,那就像:“关心能力”=我赢得50%的机会有多近?但有了领带,事情就变得复杂了。

我不确定这是绝对必要的,但是如果你需要的话,你可以假设一场胜利是0,一场平局会给你1分,一场胜利会给你2分。换句话说,从一场输到一场平局是一样有价值的,就像从一场平局到一场胜利一样。

你也可以假设所有游戏都是独立的。基本上,我只是在寻找“护理能力”的定量度量(例如,从0到1的一个值)。

有谁能想到怎么处理这种事吗?如果你是一个经济人,你可以想象我有有限的钱可以花在提高我赢得比赛的机会上。你将如何分配这些钱在整个游戏,以最大化您的预期结果?

提前感谢!

编辑:对不起,我已经意识到这是一个措辞很差的问题。我没有具体说明额外投资和产生的结果之间的关系。我想假设这是一个线性关系,但是在这种情况下,你投资哪个游戏并不重要,因为它总是以同样的方式增加你的期望值。我的实际问题有点复杂,我需要重新考虑一下。感谢大家的帮助和提供了伟大的想法!

EN

回答 3

Stack Overflow用户

发布于 2010-10-07 08:54:09

您可以将其表述为一个受限的优化问题。

我现在要忽略抽签.

所以你需要做的是首先让a_i成为你在游戏i上的花费。

我赢得比赛的机会大概是a_i的一个函数。叫它p_i(a_i)

你对游戏I的预期支出是2* p_i(a_i)

因此,您的预期支出总额为P= 2* Sum( p_i(a_i) )。

你对你的花费有一些限制.和(A_i)=A

你的目标是在受约束的情况下使P最大化。

用拉格朗日方法,给出了N+1方程同时求解的未知数a_i和lambda。

像这样的n个方程:

代码语言:javascript
复制
 2 p_i'(a_i) = lambda  

和一个约束方程

代码语言:javascript
复制
 sum(a_i) = total

如何解决这些问题将取决于您的p_i函数的结构。根据您的结构或p_i函数,您可能需要引入每个a_i > 0的访问约束。我试图构造我的p_i,以避免这一点,因为它使得求解方程更加困难。

如果你想引入一个平局的机会,你可以把你的p_i(a_i)分成w_i(a_i)和d_i(a_i),然后把每个游戏的支出改为2* w_i(a_i) +1* d_i(a_i)。虽然这并没有改变任何核心数学。

票数 1
EN

Stack Overflow用户

发布于 2010-10-07 08:43:06

,但对于一场50/50的比赛,我会非常关心,并想投入到最大的努力。如果没有关系,那就像:“关心能力”=我赢得50%的机会有多近?但有了领带,事情就变得复杂了。

我不这样认为。如果你在寻找一种50/50获胜机会的游戏,它不是只是在计算“我赢得的几率有多近,再加上一半的机会将与50%打成平手”--还是我没有回答你的问题?

编辑:

公式将如下所示:

代码语言:javascript
复制
x = 1 - abs(0.5-abs(win% + tie%/2));
                 ^ the inner 'abs' here may be useless, but i'm not sure ;)
票数 0
EN

Stack Overflow用户

发布于 2010-10-07 08:51:38

我认为你需要考虑的最明显的事情是,改变概率需要多少资源(努力,美元,什么)?

使用美元作为一个简单的例子,如果你有一个游戏,你现在有0%的机会获胜,但1美元将给你50%的机会获胜,那么这是一个更好的选择,如果1美元将使50%的机会赢得,成为一个99%的机会。

从广义上讲,我认为你需要在每场比赛的赢/平/输中应用一个值(正如你已经提到的)。然后,你可以计算出你目前的预期总价值(如50%的胜利,25%的平局和25%的损失将给0.5*2+0.25*1+0.25*0 =1.25分)。这样做的目的是利用你所有的资源尽可能地提高总期望值。

最后一步完全依赖于您的资源才能成功。对此函数的分析可能会使其成为一个简单的解决方案。

一些例子努力公式:

1)线性-一个资源单位将增加你在X中获胜和平局的可能性。

这将意味着,只要你还没有消除失败的机会,你把精力放在哪里并不重要。把精力投入到你可能输掉的任何游戏中。

2)相反--你赢/抽的机会越小,你的利益就越高。

如果一个单位的努力产生的“X/赢机会”增加,以赢得机会,那么你显然会得到最大的好处,从你的最坏的游戏。

( 3)中点趋势--你越接近于一个相等的胜负,你就越受益。

这模拟了这样一个事实:如果你很有可能赢,或者很有可能输,那么最不可能改进(如果有人比你好得多,那么努力可能并不重要)。在这种情况下,您可能希望集中精力于那些几乎等于赢/失去机会的人,试图获得最大的增加。

我希望这是合理的。:)

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/3879911

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档