文章/答案/技术大牛

发布

社区首页 >问答首页 >数据挖掘中的“相似性”

问数据挖掘中的“相似性”
EN

Stack Overflow用户

提问于 2010-05-22 17:16:34

回答 5查看 2.5K关注 0票数 9

在数据挖掘领域，有没有一个特定的子学科叫做“相似度”？如果是，它处理的是什么。任何例子，链接，参考资料都会很有帮助。

此外，作为该领域的新手，我希望社区对数据挖掘和人工智能之间的关系有多密切发表意见。它们是同义词吗，一个是另一个的子集吗？

提前感谢您分享您的知识。

artificial-intelligence

data-mining

similarity

回答 5

Stack Overflow用户

回答已采纳

发布于 2010-05-22 17:24:23

在数据挖掘领域，有没有一个特定的子学科叫做“相似性”？

是。在数据挖掘和机器学习中有一个特定的子领域，称为度量学习，其目标是在数据实例之间学习更好的距离度量。

你知道下面的任何概念吗？

Euclidean distance

Mahalanobis distance

Pearson correlation

Cosine similarity和here

内核函数

在你了解了这些之后，你就会知道什么是“相似性”。

我想听听社区对数据挖掘和人工智能之间的关系有多密切的看法。

很难区分什么是数据挖掘，什么是人工智能。当你是这个领域的新手时，不要讨论这个问题。当你学习了数据挖掘中的10种算法并阅读了一些AI书籍时，你就会知道它们之间的区别和联系。

票数 9

Stack Overflow用户

发布于 2010-05-22 17:20:56

“相似性”(提取哪些特征，之后如何处理)的适当定义几乎就是聚类的定义，而聚类是数据挖掘的一个相当广泛的子领域。

如果你将人工智能的标准定义为我们不能很好地解决的一组问题(实际上，我们不能很好地指定开始解决)，那么一旦你寻找相关性的空间开始超过你的算法所能处理的范围，数据挖掘就会影响到它。

票数 2

Stack Overflow用户

发布于 2011-06-28 13:56:58

只是为了强调“相似性”概念的重要性。

数据挖掘(AI，机器学习，建模等)是关于将某些函数赋予其最大值或最小值。采用最好的优化/学习/挖掘算法和一个错误的函数，你会得到一个完整的垃圾。请注意，我们使用"value“而不是"valueS”。这是因为(据我所知)没有能够优化多个值的算法(计算型或其他)。然而，在我们的宇宙中，复杂的优化比一维的优化更频繁(我们希望变得富有、年轻和健康)。这就是为什么存在过多的相似度和其他评分函数。这就是为什么他们中没有一个是“正确的”

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/2887541

复制

相似问题

问数据挖掘中的“相似性”
EN

回答 5

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问数据挖掘中的“相似性”EN

回答 5

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问数据挖掘中的“相似性”
EN