我正计划制作一个网站,用户可以在其中使用经过训练的AI agent.How玩简单的游戏,以便在web服务上部署经过训练的强化学习模型?我们可以使用tensorflow吗?Andrej Karapathy的convnet.js框架对此有用吗?
发布于 2017-11-07 18:20:02
我已经尝试过convnet.js,也尝试过其他javascript库来做同样的事情,但都没有用。你永远不会知道神经网络发生了什么。即使在我训练了一整天的代理之后,它也没有提供任何显着的输出。
我的建议是让python程序成为一个web服务,你可以使用flask。当需要采取行动时,从游戏中调用Webservice。该服务将仅返回操作。通过这种方式,您将具有了解正在运行的内容的优势。您可以很容易地绘制图表并注意到变化。
下面是我的Web服务代码片段
from flask import Flask
from flask import request
from flask_cors import CORS
app = Flask(__name__)
CORS(app)
@app.route("/update", methods=['POST'])
def rest_update():
reward = request.form.get('reward')
reward = float(reward)
state = request.form.get('state')
state = state.split(',')
new_state = []
for each in state:
new_state.append(float(each))
return str(brain.update(reward,new_state))
if __name__ == '__main__':
app.run(debug=True)更新是以奖励和状态作为输入和返回动作的函数。状态以逗号(,)分隔的字符串形式输入。这个方法非常适合我的项目。
编辑:你可以使用python的任何库,只要你觉得舒服。它可以是pytorch、tensorflow或任何其他类型。
https://stackoverflow.com/questions/45782813
复制相似问题