首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >数据挖掘中的“相似性”

数据挖掘中的“相似性”
EN

Stack Overflow用户
提问于 2010-05-22 17:16:34
回答 5查看 2.5K关注 0票数 9

在数据挖掘领域,有没有一个特定的子学科叫做“相似度”?如果是,它处理的是什么。任何例子,链接,参考资料都会很有帮助。

此外,作为该领域的新手,我希望社区对数据挖掘和人工智能之间的关系有多密切发表意见。它们是同义词吗,一个是另一个的子集吗?

提前感谢您分享您的知识。

EN

回答 5

Stack Overflow用户

回答已采纳

发布于 2010-05-22 17:24:23

在数据挖掘领域,有没有一个特定的子学科叫做“相似性”?

是。在数据挖掘和机器学习中有一个特定的子领域,称为度量学习,其目标是在数据实例之间学习更好的距离度量。

你知道下面的任何概念吗?

Euclidean distance

Mahalanobis distance

Pearson correlation

Cosine similarityhere

内核函数

在你了解了这些之后,你就会知道什么是“相似性”。

我想听听社区对数据挖掘和人工智能之间的关系有多密切的看法。

很难区分什么是数据挖掘,什么是人工智能。当你是这个领域的新手时,不要讨论这个问题。当你学习了数据挖掘中的10种算法并阅读了一些AI书籍时,你就会知道它们之间的区别和联系。

票数 9
EN

Stack Overflow用户

发布于 2010-05-22 17:20:56

“相似性”(提取哪些特征,之后如何处理)的适当定义几乎就是聚类的定义,而聚类是数据挖掘的一个相当广泛的子领域。

如果你将人工智能的标准定义为我们不能很好地解决的一组问题(实际上,我们不能很好地指定开始解决),那么一旦你寻找相关性的空间开始超过你的算法所能处理的范围,数据挖掘就会影响到它。

票数 2
EN

Stack Overflow用户

发布于 2011-06-28 13:56:58

只是为了强调“相似性”概念的重要性。

数据挖掘(AI,机器学习,建模等)是关于将某些函数赋予其最大值或最小值。采用最好的优化/学习/挖掘算法和一个错误的函数,你会得到一个完整的垃圾。请注意,我们使用"value“而不是"valueS”。这是因为(据我所知)没有能够优化多个值的算法(计算型或其他)。然而,在我们的宇宙中,复杂的优化比一维的优化更频繁(我们希望变得富有、年轻和健康)。这就是为什么存在过多的相似度和其他评分函数。这就是为什么他们中没有一个是“正确的”

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/2887541

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档