我希望在每个时代,在不同的x/y配对数据集上训练一个周期损失(类似于CycleGAN)的模型。其目的是,在许多时代,该模型将被训练的许多,如果不是所有的元素x与y的可接受配对。
例如,假设2个数据集:x_tf_data和y_tf_data。x_tf_data的每个元素可以与y_tf_data的一个或多个元素配对。例如,x_tf_data的第一个元素可以与y_tf_data的前10个元素配对。这是由表示list_vectors的向量列表给出的,因此list_vectors[0] = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]和list_vectors[i-1]是可以与list_vectors的第一个元素配对的y_tf_data元素。
x_tf_data的第一个元素可以与y_tf_data的前10个元素中的任何元素配对。这可以通过在每个时代随机选择list_vectors[i]的一个元素来实现,所有i都是如此。什么是可伸缩的解决方案?
发布于 2022-06-16 12:38:24
经过大量的实验,最有效的方法是创建N个tf.data数据集,其中x的每个元素与随机选择的y元素配对,然后依次将N个数据集连接起来形成一个庞大的数据集。然后将此数据集保存到文件中并读入Keras。这实现了两个目标。它帮助模型更快地收敛,因为所有的数据不改变每一个时代,它有助于确保对x的每一个元素使用足够数量的配对,以获得稳健的结果。
https://stackoverflow.com/questions/72639335
复制相似问题