我正在尝试使用DeepLearning4j库在Java语言中实现deep deterministic policy gradient algorithm,但是在有效地实现策略梯度时遇到了一些问题。
在许多tensorflow实现中,策略梯度是使用以下简单命令计算的
tf.gradients(output, network_params, -action_gradient)是否也可以使用DeepLearning4J库以一种简单的方式完成此操作?
发布于 2017-05-30 04:59:30
https://stackoverflow.com/questions/43794279
复制相似问题