我目前正在学习数据挖掘,我有以下问题。
发布于 2011-09-21 15:36:45
数据挖掘是从数据中提取有用信息的过程,如模式、趋势、客户/用户行为、喜欢/不喜欢等,这涉及到人工智能和统计学相关算法的使用。
维基百科对数据挖掘的定义是:
数据挖掘( Data )(数据库过程中的知识发现的分析步骤,1或KDD)是计算机科学一个相对年轻的跨学科领域,2是从大数据集中发现新模式的过程,涉及到统计学和人工智能的方法,也包括数据库管理。相对于机器学习,重点在于发现以前未知的模式,而不是将已知的模式推广到新的数据。
机器学习包括让计算机“学习”那种行为、趋势等,并按此行事。例如,在信用卡欺诈中,计算机“了解”客户的行为,如果发生了一些奇怪的事情(涉及很高金额的交易等),计算机就会将该交易标记为潜在的欺诈行为。
维基百科对机器学习的定义是:
机器学习是人工智能的一个分支,它是一门涉及设计和发展算法的科学学科,它允许计算机根据经验数据(如传感器数据或数据库)来进化行为。机器学习是指在表示统计现象不完全信息的观测数据的基础上,通过归纳推理实现机器学习的算法的发展。分类也被称为模式识别,是机器学习中的一项重要任务,通过它机器“学习”自动识别复杂的模式,根据不同的模式区分样本,并做出智能决策。
机器学习使用数据挖掘来学习模式、行为、趋势等,因为数据挖掘是从一组数据中提取这些信息的方法。数据挖掘和机器学习都使用统计进行决策。因此,统计是非常重要的,在数据挖掘和机器学习中是非常重要的。
发布于 2011-09-21 15:25:26
不同的人所称的机器学习、数据挖掘和统计之间往往有很多重叠。这些术语的定义将取决于你问谁。
这是一个不错的概述,有很多很好的链接。
发布于 2022-03-25 17:21:51
虽然数据挖掘和机器学习之间存在重叠,但我们可以区分它们;简单来说,例如:数据挖掘搜索用于预测和/或描述海量数据的模式,机器学习将进一步利用这些模式来学习。两者都是基于统计数据的。
https://stackoverflow.com/questions/7502337
复制相似问题