文章/答案/技术大牛

发布

社区首页 >问答首页 >强化学习在优化问题中的应用

问强化学习在优化问题中的应用
EN

Data Science用户

提问于 2021-11-15 10:48:12

回答 1查看 69关注 0票数 3

问题陈述:我们被给予一个优化问题，生产中心，源机场，目的地机场，转运站，并最终交付给客户。下面的图片更好地解释了这一点。

目标函数1:最小化成本=库存成本+运输成本+罚款成本+装卸成本

库存成本=货源机场的库存成本+配送中心的库存成本
运输费用=从生产中心向货源机场运送货物的费用(通过卡车)+通过航线运输货物的费用(通过航班)+将货物从配送中心运送到转运站的费用(通过卡车)+从转运站向客户运送货物的费用(通过无人机)
罚款费用=经营飞行路线的费用和延误罚款费用
装卸费用=在生产中心卡车上装载货物的费用+在转运点从卡车卸货的费用

数学解决方案(使用IBM / Docplex)：包含该公式的完整python代码(.ipynb文件)出现在此谷歌驱动器链接中。这给出了一个最优解。

问题:是否有任何非数学的，非公式的方法来解决这个问题的陈述？关于强化学习的东西？如果还提供任何实现，它将是锦上添花。

optimization

python

deep-learning

reinforcement-learning

回答 1

Data Science用户

发布于 2022-02-26 17:01:08

为了把这个问题用强化学习(RL)来解决，首先定义一个agent。代理将在环境中尝试不同的策略。结果会带来更高回报的政策将被更频繁地使用。

这个问题相对简单(对于一个RL问题)，因为环境可以被建模为一个有向无环图(DAG)，具有固定的离散节点集。蛮力策略搜索可能有效。

票数 0

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/104157

复制

相似问题

问强化学习在优化问题中的应用
EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问强化学习在优化问题中的应用EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问强化学习在优化问题中的应用
EN