从这里交叉
这个问题是询问有关使用deepmind库的指导/建议/帮助:深井实验室或TensorFlow在Python中。
考虑到我是新的概念,如深入学习和人工智能。
问题如下:
使用一种类似于此页中基于观察、行动、奖励等描述的方法,我想调用一个学习代理在一些价值中进行选择。我在想这样的事情:
补充说明:
输入如下所示:
edge: (1, 2), face_down: 4, face_up: 5, face_left: 4, face_right: 5
edge: (0, 1), face_down: 4, face_up: 4, face_left: 4, face_right: 5
edge: (5, 4), face_down: 4, face_up: 5, face_left: 4, face_right: 5
edge: (6, 7), face_down: 3, face_up: 5, face_left: 5, face_right: 5
edge: (3, 0), face_down: 4, face_up: 4, face_left: 5, face_right: 4
edge: (4, 1), face_down: 4, face_up: 5, face_left: 5, face_right: 4
edge: (8, 5), face_down: 4, face_up: 5, face_left: 5, face_right: 4
edge: (3, 8), face_down: 4, face_up: 5, face_left: 4, face_right: 5
edge: (2, 3), face_down: 4, face_up: 5, face_left: 5, face_right: 4
edge: (5, 0), face_down: 4, face_up: 4, face_left: 5, face_right: 4
edge: (0, 5), face_down: 4, face_up: 4, face_left: 4, face_right: 5
edge: (1, 0), face_down: 4, face_up: 4, face_left: 5, face_right: 4
edge: (9, 6), face_down: 3, face_up: 5, face_left: 5, face_right: 5
edge: (0, 3), face_down: 4, face_up: 4, face_left: 4, face_right: 5
edge: (7, 9), face_down: 3, face_up: 5, face_left: 5, face_right: 5这样做的目的是使用同样的deepmind来玩游戏,而不是分析像素和使用pad (上、下、左、右、火、跳),而是让学习代理分析一些数学值,作为唯一的行动,选择其中一个。
是否有其他方法或库/框架来解决这一问题?

发布于 2017-05-04 09:58:04
我建议您看看OpenAI健身房。
您将更容易地实现一个描述问题的新环境。关于代理,有许多与OpenAI兼容的实现。
https://datascience.stackexchange.com/questions/17648
复制相似问题