我在问自己,为什么乙状结肠函数1/(1+e^-x)中使用eulers数而不是其他常量,比如2或3?
我对数据科学非常陌生,但我读到的是曲线的自然增长,所以这是否意味着eulers数被用于sigmoid函数,因为它使输出在0和1之间均匀分布的值成为可能?
发布于 2018-10-17 22:59:22
欧拉的数字自然出现在许多地方;与增长率无关,但很容易在共同的范围内出现。
乙状结肠函数的形式没有被选择,因为它的导数有一个很好的性质,尽管这是正确的。也没有选择它,因为它是一个范围(0,1)的函数;许多函数都是这样做的。
生成sigmoid函数是因为它是对常见问题类型的正确答案。我们认为logistic回归是预测类概率的一种常用分类器,但它实际上是一种隐式回归。但这并不是概率的回归,而是概率的对数概率(logit函数)。这是应用回归的正确方法,给出了关于分类问题中误差分布的假设,这些假设与简单的线性回归不同。
sigmoid函数是logit链接函数的逆函数。这就是为什么它在那里。它从回归输出到实际期望的输出,概率。logit函数之所以存在,是因为它是由关于0/1因变量分布的假设所隐含的。
实际上就是这样。它必须存在于某些类型的常见问题中,因为它是这些问题的答案,而不是因为它被选择用于优良的属性。
发布于 2018-10-17 20:19:24
因为您需要最小化包含输出的错误,即获取错误的导数并将其设置为零(基本上)。如果输出来自sigmoid,那么您有一个非常好的特性:乙状结肠的导数可以使用它自己编写!
如果您使用常量a,那么一个术语ln(a)将破坏美丽的属性!
PS:常数只是缩放函数的形状,也就是说,如果你增加它,你就会在0或1之前达到值。见下文:

发布于 2018-10-17 23:14:29
它们是等价物。例如,0.5^{x\cdot\beta}=e^{(\ln0.5)\cdot x \cdot \beta}=e^{x \cdot \beta’}
使用e使衍生产品更加优雅。
https://datascience.stackexchange.com/questions/39842
复制相似问题