发布于 2017-04-10 20:08:35
当有大量输出类时,使用softmax。主要原因是,如果你使用正常的软最大损失,对于高数量的输出类,比如说5000,它是非常低效的,对我们的计算机来说,计算起来很困难。因此,当计算softmax损失时,样本softmax将只考虑k个类的数量,而不是总类数。
使用的一个例子是序列在tensorflow.中的序列模型。
这些模块可以以顺序的方式预测发生的事情。比如说,给定一个句子,预测下一个单词。因此,在这里,为了预测单词,您有许多输出类。在本例中,等于词汇表大小。因此,在这方面,样本softmax是非常方便的。链接到tensorflow seq2seq模型
https://stackoverflow.com/questions/40401187
复制相似问题