首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Minimax Linkage是Lance-Williams层次聚类吗?

Minimax Linkage是Lance-Williams层次聚类吗?
EN

Data Science用户
提问于 2015-09-02 13:34:53
回答 1查看 275关注 0票数 10

我在基于Minimax链接的带原型的分层聚类上找到了下面的文章。

“财产6”中指出

Minimax链接不能使用兰斯-威廉姆斯更新来编写。

用反例给出了一个简洁的证明:

证据。图9显示了一个简单的一维示例,如果遵循Lance更新,则不可能出现minimax链接。上面板和下面板显示两个点的配置,其中(4)的右侧相同,但左侧不同;特别是上面板的d(G_1 \cup G_2,H) = 9,下面板的d(G_1 \cup G_2,H) = 8

但我不明白他们的证据。对于两种情况(上面板和下面板),d(G_1,H) = 16d(G_2,H) = 7d(G_1,G_2) = 5

我看不出第一种情况下的\alpha(G_2)必须等于第二种情况下的\alpha(G_2)。例如,G_2没有相同的基数。

EN

回答 1

Data Science用户

发布于 2020-07-10 12:02:17

我在快速阅读了参考资料后采取的措施。

首先,兰斯和威廉斯的原始论文提到它们的线性方案只适用于组合策略(并提供了计算优势)。极小极大连接是这样的组合策略吗?换句话说,它是否与成对距离(线性)有关?通过极小极大距离的定义,很明显这是不可信的。

这就像meanmedian计算在统计学上的区别一样。平均值是线性的,而中值是非线性的。没有线性组合可以从median计算mean (虽然在某些有限的情况下它们可以重合)。

其次,提交人在假设的Lance方法中没有提到\alpha, \beta, \gamma参数的形式(或值)。但在任何情况下,它们都是常量,\alpha(\cdot)可以是相应集群大小的常量函数或有理函数(根据最初的Lance引用)。

G_2在两个面板中可能不具有相同的基数,但极小极大连接距离取决于簇的半径而不是基数(不像平均值或质心连接),而且两个例子的半径相同,因此在这两种情况下\alpha(G_2)是相同的。

另一种看到这种情况的方法是证明的一种可能的变化,在这两种情况下,G_2都具有相同的半径和相同的基数,但配置不同。

也许这样的证据会让事情变得更清楚。但我现在就不谈了。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/6986

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档