首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >基于强化学习的多目标优化

基于强化学习的多目标优化
EN

Stack Overflow用户
提问于 2012-11-12 20:00:19
回答 1查看 372关注 0票数 3

我正在研究一个系统的电源管理。我希望最小化的目标是功耗和平均延迟。我有一个单一的目标函数,它具有两个目标的线性加权和:

代码语言:javascript
复制
C=w.P_avg+(1-w).L_avg,      where w belongs to (0,1)

我正在使用Q-learning通过改变权重w并对功耗和平均延迟设置不同的偏好来找到一条pareto最优的权衡曲线。我确实得到了一条帕累托最优曲线。现在,我的目标是提供一个约束(例如,平均延迟L_avg),从而调整/找到w的值以满足给定的标准。我的是一个在线算法,所以w的调整应该以在线的方式进行。

在这方面,我能得到任何提示或建议吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2012-11-20 06:58:47

社区中有一个多目标强化学习分支。

理想化的是1

为每个目标分配一组智能体。将一个族中的智能体获得的解与其余族中的智能体获得的解进行比较。协商机制用于找到满足所有目标的折衷解决方案。

还有一篇你可能会感兴趣的论文:

电力系统调度和电压稳定的强化学习多目标优化。

不过,我没有找到它的公共url。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/13343336

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档