理查德·埃文斯在2010年GDC大会上发表了关于模拟人生3人工智能的演讲。他在演示幻灯片中详细介绍了该算法:
http://www.gdcvault.com/play/1012450/Modeling-Individual-Personalities-in-The
在幻灯片36中,他描述了他们如何将效用分数转换为概率分布,AI使用该概率分布来随机选择要采取的行动。
有人能解释一下概率分布是如何计算出来的吗?我试图通过使用简化的Boltzmann方程来计算幻灯片36中显示的概率,并从左侧的图表和幻灯片38的“温度”中估计效用分数,但我无法得到与幻灯片36右侧显示的图表相似的结果。
发布于 2015-04-30 06:10:52
一组效用指标的概率分布只是计算任何效用在整体上所占的百分比。
例如: Eat = 10,Sleep = 100,Hunt = 20
你吃东西的概率是10/130。或者0.0769。或7.7%。
睡眠占76.9%。Hunt为15.4%。
你让智能体通过掷骰子和选择落入这三个桶中的一个来决定要做什么。可能是睡着了。这就是你满足的方式:
"Choose randomly using the score distribution as the probability distribution"至于他的幻灯片和他的“简化的玻尔兹曼方程”。他加入了另一个变量和步骤,这并没有真正描述出来。显然,这与压力有关。但您不会将左侧的图表转换为右侧的图表,因为您没有所需的所有信息。因为这一切都是胡扯。是模拟人生,你觉得它有多深?
https://stackoverflow.com/questions/29952927
复制相似问题