首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >为什么三角法则在数据挖掘中如此重要

为什么三角法则在数据挖掘中如此重要
EN

Stack Overflow用户
提问于 2012-09-03 05:23:28
回答 1查看 426关注 0票数 1

我很想知道为什么三角形定律对于更好的数据mining.As如此重要,因为我知道三角形定律可以帮助我们定义模式,并根据不同objects.Does之间的距离形成集群。有人对三角形定律有其他输入吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2012-09-03 16:01:18

这其实并不那么重要。在数据挖掘中,我们通常不能假设有一个适当的“数学”距离函数。一旦我们允许重复,我们就已经失去了一个关键公理--我们可以拥有两个距离为0的不同对象。(在分类中,在最坏的情况下,它们甚至可能有不同的类)。

然而,三角形不等式可以让我们修剪搜索空间。如果我们有一个满足三角形不等式的距离函数,并使用适当的索引,我们可以跳过大量的计算,从而使算法更快。

请注意,许多研究和实现并不太关心这种优化。许多使用R的数据挖掘者喜欢构建距离矩阵(这是在O(n^2)中!)然后尝试尽可能多地使用矩阵运算,因为这很容易编程,并且R在这种运算中相当快(使用高度优化的C代码,而不是解释的R代码)。但如果您需要超越这一点,性能的一个关键因素是尽可能利用三角不等式。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/12239847

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档