文章/答案/技术大牛

发布

社区首页 >问答首页 >混合专家-只在每次迭代时训练最佳模型

问混合专家-只在每次迭代时训练最佳模型
EN

Stack Overflow用户

提问于 2017-02-08 09:44:28

回答 1查看 837关注 0票数 3

我试图在tensorflow - https://arxiv.org/abs/1701.06538的混合专家论文的基础上实现一种粗略的方法。

将定义n模型：

    model_1:
        var_11
        var_12
        loss_1
        optimizer_1

    model_2:
        var_21
        var_22
        loss_2
        optimizer_2

    model_3:
        var_31
        var_32
        loss_3
        optimizer_3

在每次迭代时，我只想训练损失最小的模型，同时保持其他变量不变。是否可以放置一个开关以只执行优化器之一？

P.S:这个问题的基础和我之前问过的类似。http://stackoverflow.com/questions/42073239/tf-get-collection-to-extract-variables-of-one-scope/42074009?noredirect=1#comment71359330_42074009

既然那里的建议行不通，我正试图以不同的方式处理这个问题。

提前感谢！

python

tensorflow

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-02-08 22:58:02

这在tf.cond看来是可行的。

import tensorflow as tf

def make_conditional_train_op(
    should_update, optimizers, variable_lists, losses):
  """Conditionally trains variables.

  Each argument is a Python list of Tensors, and each list must have the same
  length. Variables are updated based on their optimizer only if the
  corresponding `should_update` boolean Tensor is True at a given step.

  Returns a single train op which performs the conditional updates.
  """
  assert len(optimizers) == len(variable_lists)
  assert len(variable_lists) == len(losses)
  assert len(should_update) == len(variable_lists)
  conditional_updates = []
  for model_number, (update_boolean, optimizer, variables, loss) in enumerate(
      zip(should_update, optimizers, variable_lists, losses)):
    conditional_updates.append(
        tf.cond(update_boolean,
                lambda: tf.group(
                    optimizer.minimize(loss, var_list=variables),
                    tf.Print(0, ["Model {} updating".format(model_number), loss])),
                lambda: tf.no_op()))
  return tf.group(*conditional_updates)

基本策略是确保在其中一个lambda分支的cond中定义优化器的变量更新，在这种情况下有真正的条件op执行，这意味着只有在触发cond的分支时才会对变量(和优化器累加器)进行赋值。

作为一个例子，我们可以构造一些模型：

def make_model_and_optimizer():
  scalar_variable = tf.get_variable("scalar", shape=[])
  vector_variable = tf.get_variable("vector", shape=[3])
  loss = tf.reduce_sum(scalar_variable * vector_variable)
  optimizer = tf.train.AdamOptimizer(0.1)
  return optimizer, [scalar_variable, vector_variable], loss

# Construct each model
optimizers = []
variable_lists = []
losses = []
for i in range(10):
  with tf.variable_scope("model_{}".format(i)):
    optimizer, variables, loss = make_model_and_optimizer()
  optimizers.append(optimizer)
  variable_lists.append(variables)
  losses.append(loss)

然后确定一个有条件的更新策略，在这种情况下，只使用最大损失来训练模型(仅仅因为这会导致更多的切换；如果只有一个模型更新，输出就会相当乏味)：

# Determine which model should be updated (in this case, the one with the
# maximum loss)
integer_one_hot = tf.one_hot(
    tf.argmax(tf.stack(losses),
              axis=0),
    depth=len(losses))
is_max = tf.equal(
    integer_one_hot,
    tf.ones_like(integer_one_hot))

最后，我们可以调用make_conditional_train_op函数来创建列车操作，然后执行一些训练迭代：

train_op = make_conditional_train_op(
    tf.unstack(is_max), optimizers, variable_lists, losses)

# Repeatedly call the conditional train op
with tf.Session():
  tf.global_variables_initializer().run()
  for i in range(20):
    print("Iteration {}".format(i))
    train_op.run()

这将打印更新的索引及其在每次迭代中的丢失，从而确认条件执行：

Iteration 0
I tensorflow/core/kernels/logging_ops.cc:79] [Model 6 updating][2.7271919]
Iteration 1
I tensorflow/core/kernels/logging_ops.cc:79] [Model 6 updating][2.1755948]
Iteration 2
I tensorflow/core/kernels/logging_ops.cc:79] [Model 2 updating][1.9858969]
Iteration 3
I tensorflow/core/kernels/logging_ops.cc:79] [Model 6 updating][1.6859927]

票数 4

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/42109590

复制

相似问题

问混合专家-只在每次迭代时训练最佳模型
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问混合专家-只在每次迭代时训练最佳模型EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问混合专家-只在每次迭代时训练最佳模型
EN