文章/答案/技术大牛

发布

社区首页 >问答首页 >从连续到连续的强化学习方法

问从连续到连续的强化学习方法
EN

Stack Overflow用户

提问于 2012-07-28 07:47:54

回答 1查看 1.2K关注 0票数 3

我正在建立一个模型，在这个模型中，公司必须设定价格并做出生产决策。价格是连续的，决策变量也是连续的。(库存、上次销售、价格...)。

我可以使用什么强化学习方法来将连续映射到连续？有哪些python包？如果没有python包，我可以编写一个包装器。

回答已采纳

发布于 2012-07-28 07:54:40

PyBrain机器学习库就是你要找的。这是一个相当复杂的神经网络实现，但当你理解它时，你会得到一个真正强大的工具。

PyBrain是一个用于神经网络建模的python库。Overview of the PyBrain应该会给你一个基本的概念:在每个时间戳上，你为神经网络提供一组连续值，并取出另一组连续值。但更重要的是，你可以评估输出并训练你的神经网络。

所有这些步骤-包括网络培训-都已经在PyBrain中实现。

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/11696990

复制

相似问题

问从连续到连续的强化学习方法EN