首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >强化学习在优化问题中的应用

强化学习在优化问题中的应用
EN

Data Science用户
提问于 2021-11-15 10:48:12
回答 1查看 69关注 0票数 3

问题陈述:我们被给予一个优化问题,生产中心,源机场,目的地机场,转运站,并最终交付给客户。下面的图片更好地解释了这一点。

目标函数1:最小化成本=库存成本+运输成本+罚款成本+装卸成本

  1. 库存成本=货源机场的库存成本+配送中心的库存成本
  2. 运输费用=从生产中心向货源机场运送货物的费用(通过卡车)+通过航线运输货物的费用(通过航班)+将货物从配送中心运送到转运站的费用(通过卡车)+从转运站向客户运送货物的费用(通过无人机)
  3. 罚款费用=经营飞行路线的费用和延误罚款费用
  4. 装卸费用=在生产中心卡车上装载货物的费用+在转运点从卡车卸货的费用

数学解决方案(使用IBM / Docplex):包含该公式的完整python代码(.ipynb文件)出现在此谷歌驱动器链接中。这给出了一个最优解。

问题:是否有任何非数学的,非公式的方法来解决这个问题的陈述?关于强化学习的东西?如果还提供任何实现,它将是锦上添花。

EN

回答 1

Data Science用户

发布于 2022-02-26 17:01:08

为了把这个问题用强化学习(RL)来解决,首先定义一个agent。代理将在环境中尝试不同的策略。结果会带来更高回报的政策将被更频繁地使用。

这个问题相对简单(对于一个RL问题),因为环境可以被建模为一个有向无环图(DAG),具有固定的离散节点集。蛮力策略搜索可能有效。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/104157

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档