首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >从连续到连续的强化学习方法

从连续到连续的强化学习方法
EN

Stack Overflow用户
提问于 2012-07-28 07:47:54
回答 1查看 1.2K关注 0票数 3

我正在建立一个模型,在这个模型中,公司必须设定价格并做出生产决策。价格是连续的,决策变量也是连续的。(库存、上次销售、价格...)。

我可以使用什么强化学习方法来将连续映射到连续?有哪些python包?如果没有python包,我可以编写一个包装器。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2012-07-28 07:54:40

PyBrain机器学习库就是你要找的。这是一个相当复杂的神经网络实现,但当你理解它时,你会得到一个真正强大的工具。

PyBrain是一个用于神经网络建模的python库。Overview of the PyBrain应该会给你一个基本的概念:在每个时间戳上,你为神经网络提供一组连续值,并取出另一组连续值。但更重要的是,你可以评估输出并训练你的神经网络。

所有这些步骤-包括网络培训-都已经在PyBrain中实现。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/11696990

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档