在数据挖掘领域,有没有一个特定的子学科叫做“相似度”?如果是,它处理的是什么。任何例子,链接,参考资料都会很有帮助。
此外,作为该领域的新手,我希望社区对数据挖掘和人工智能之间的关系有多密切发表意见。它们是同义词吗,一个是另一个的子集吗?
提前感谢您分享您的知识。
发布于 2010-05-22 17:24:23
在数据挖掘领域,有没有一个特定的子学科叫做“相似性”?
是。在数据挖掘和机器学习中有一个特定的子领域,称为度量学习,其目标是在数据实例之间学习更好的距离度量。
你知道下面的任何概念吗?
Euclidean distance
Mahalanobis distance
Pearson correlation
内核函数
在你了解了这些之后,你就会知道什么是“相似性”。
我想听听社区对数据挖掘和人工智能之间的关系有多密切的看法。
很难区分什么是数据挖掘,什么是人工智能。当你是这个领域的新手时,不要讨论这个问题。当你学习了数据挖掘中的10种算法并阅读了一些AI书籍时,你就会知道它们之间的区别和联系。
发布于 2010-05-22 17:20:56
“相似性”(提取哪些特征,之后如何处理)的适当定义几乎就是聚类的定义,而聚类是数据挖掘的一个相当广泛的子领域。
如果你将人工智能的标准定义为我们不能很好地解决的一组问题(实际上,我们不能很好地指定开始解决),那么一旦你寻找相关性的空间开始超过你的算法所能处理的范围,数据挖掘就会影响到它。
发布于 2011-06-28 13:56:58
只是为了强调“相似性”概念的重要性。
数据挖掘(AI,机器学习,建模等)是关于将某些函数赋予其最大值或最小值。采用最好的优化/学习/挖掘算法和一个错误的函数,你会得到一个完整的垃圾。请注意,我们使用"value“而不是"valueS”。这是因为(据我所知)没有能够优化多个值的算法(计算型或其他)。然而,在我们的宇宙中,复杂的优化比一维的优化更频繁(我们希望变得富有、年轻和健康)。这就是为什么存在过多的相似度和其他评分函数。这就是为什么他们中没有一个是“正确的”
https://stackoverflow.com/questions/2887541
复制相似问题