首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >tf.multinomial输出范围以外的数字

tf.multinomial输出范围以外的数字
EN

Stack Overflow用户
提问于 2018-07-04 20:59:39
回答 1查看 409关注 0票数 1

我正在使用OpenAI健身环境(使用策略梯度)。我的网络输出的动作高于可能的动作范围。

代码语言:javascript
复制
n_outputs = 9
learning_rate = 0.01

initializer = tf.variance_scaling_initializer()

X = tf.placeholder(tf.float32, shape=[None, 50, 70, 1])
network = tflearn.conv_2d(X, 32, 5, strides=2, activation='relu')
network = tflearn.max_pool_2d(network, 2)
network = tflearn.conv_2d(network, 32, 5, strides=2, activation='relu')
network = tflearn.max_pool_2d(network, 2)
network = tflearn.fully_connected(network, 256, activation='relu')
hidden = tf.layers.dense(network, 64, activation=tf.nn.relu, kernel_initializer=initializer)
logits = tf.layers.dense(hidden, n_outputs)
outputs = tf.nn.softmax(logits)
action = tf.multinomial(outputs, num_samples=1)

它输出9,这在健身房环境中产生了一个错误。

全码

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-07-04 23:39:39

如果tf.multinomial遇到数值误差,它就会在范围之外进行采样,也就是说--图中有NaNs。

票数 4
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/51180689

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档