最初的问题是在StackOverflow上发布的。然而,考虑到谢尔盖·布什马诺夫的建议,我要通过这一媒介提供一个答案。
发布于 2020-01-08 00:14:26
正如Sergey在原创问题上指出的那样,在下面的链接中可以找到对原创文章的引用。因此,我们将通过解出每个公式的分量(解释每个公式),然后对Jerome Friedmann提出的分裂准则做一个适当的解释。
p_{k}首先,让我们考虑一下\begin{align} p_{k} = exp(F_{k}(x)) / \sum_{l = 1} ^{K} \exp(F_{l}(x)), \end{align}
其中F(x)是一个逻辑转换。术语p_{k}确定了一种指数方式来考虑属于特定k类的概率,这给出了市长对更有可能发生的事件的概率,而对不太可能发生的事件的概率更小。例如,考虑到F(x)可以采用的值是1、7和49,因此
\begin{align} \frac{\exp(49)}{\exp(1) + \exp(7) + \exp(49)} \approx .9999 > \frac{\exp(7)}{\exp(1) + \exp(7) + \exp(49)} \approx 0. \end{align}
换句话说,更大的F(x)值更有可能发生。
w_{l}一旦我们知道了p_{k} \in [0,1),我们就得出了权重的定义。
\begin{align} w_{l} = \sum_{i \in R_{l}} w_{l}(x_{i}) = \sum_{i \in R_{l}}p_{k}(x_{i})(1 - p_{k}(x_{i})), \end{align} for x's in the are R_{l}。换句话说,权重是概率之和,在给定的区域l中,每个x_{i}都属于特定的k-class。这对于理解弗里德曼提出的标准至关重要,就像我们接下来会看到的那样。
最小二乘改进准则是
\begin{align} i^2(R_{l}, R_{r}) = \frac{w_{l}w_{r}}{w_{l} + w_{r}}(\overline{y_{l}}-\overline{y_{r}})^2 \:\:\:\:\:\:\:\:(1), \end{align}
考虑到我们希望将当前区域R分为两个次区域(R_{l}, R_{r})。请记住,在最后,我们希望尽可能干净地进行拆分,也就是说,结果接近该节点上所有k案例的平均结果。因此,this分裂准则不仅允许我们决定我们离期望结果有多近,而且还可以根据我们将要在区域** <#>l区域中找到的k**类的概率来决定 r。
免责声明:这是我通过阅读弗里德曼的原始论文所理解的,任何错误都应该被指出。谢谢
https://datascience.stackexchange.com/questions/66062
复制相似问题