使用softmax - softmax输出总和为1.0，这使我们能够将其解释为概率。当您想要选择一个可能的选项时-您希望将模型的结果解释为获得给定类的机会。在sigmoid的情况下-你没有这样的解释。但这只是冰山一角。在多分类的情况下-由于给定的接近1.0的概率自动使所有其他概率接近0.0，如果您的激活函数可以捕获这种依赖关系，这是可以的- softmax做到了。在sigmoid的情况下-这样的依赖关系不能直接建模-是什么使得所有的概率都接近0.0，例如，
使用categorical loss而不是binary -想象一下以下情况。您有一个属于类2的示例(可能是0，1，2，...，100 )。如果你预测这个例子属于类1--你仍然有98%的准确率--因为你正确地预测了这不是一个0，3，...，100类。请记住，这就是使用sigmoid时会发生的情况-对于每个类，您都在预测给定的类是否属于这个类。

票数 -1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/61801289

复制

相似问题

问稀疏多标签最后激活/丢失函数
EN

问稀疏多标签最后激活/丢失函数EN