我在基于Minimax链接的带原型的分层聚类上找到了下面的文章。
“财产6”中指出
Minimax链接不能使用兰斯-威廉姆斯更新来编写。
用反例给出了一个简洁的证明:
证据。图9显示了一个简单的一维示例,如果遵循Lance更新,则不可能出现minimax链接。上面板和下面板显示两个点的配置,其中(4)的右侧相同,但左侧不同;特别是上面板的d(G_1 \cup G_2,H) = 9,下面板的d(G_1 \cup G_2,H) = 8。
但我不明白他们的证据。对于两种情况(上面板和下面板),d(G_1,H) = 16,d(G_2,H) = 7,d(G_1,G_2) = 5。
我看不出第一种情况下的\alpha(G_2)必须等于第二种情况下的\alpha(G_2)。例如,G_2没有相同的基数。
发布于 2020-07-10 12:02:17
我在快速阅读了参考资料后采取的措施。
首先,兰斯和威廉斯的原始论文提到它们的线性方案只适用于组合策略(并提供了计算优势)。极小极大连接是这样的组合策略吗?换句话说,它是否与成对距离(线性)有关?通过极小极大距离的定义,很明显这是不可信的。
这就像mean和median计算在统计学上的区别一样。平均值是线性的,而中值是非线性的。没有线性组合可以从median计算mean (虽然在某些有限的情况下它们可以重合)。
其次,提交人在假设的Lance方法中没有提到\alpha, \beta, \gamma参数的形式(或值)。但在任何情况下,它们都是常量,\alpha(\cdot)可以是相应集群大小的常量函数或有理函数(根据最初的Lance引用)。
G_2在两个面板中可能不具有相同的基数,但极小极大连接距离取决于簇的半径而不是基数(不像平均值或质心连接),而且两个例子的半径相同,因此在这两种情况下\alpha(G_2)是相同的。
另一种看到这种情况的方法是证明的一种可能的变化,在这两种情况下,G_2都具有相同的半径和相同的基数,但配置不同。

也许这样的证据会让事情变得更清楚。但我现在就不谈了。
https://datascience.stackexchange.com/questions/6986
复制相似问题