我正在建立一个模型,在这个模型中,公司必须设定价格并做出生产决策。价格是连续的,决策变量也是连续的。(库存、上次销售、价格...)。
我可以使用什么强化学习方法来将连续映射到连续?有哪些python包?如果没有python包,我可以编写一个包装器。
发布于 2012-07-28 07:54:40
PyBrain机器学习库就是你要找的。这是一个相当复杂的神经网络实现,但当你理解它时,你会得到一个真正强大的工具。
PyBrain是一个用于神经网络建模的python库。Overview of the PyBrain应该会给你一个基本的概念:在每个时间戳上,你为神经网络提供一组连续值,并取出另一组连续值。但更重要的是,你可以评估输出并训练你的神经网络。
所有这些步骤-包括网络培训-都已经在PyBrain中实现。
https://stackoverflow.com/questions/11696990
复制相似问题