首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >统计、机器学习和数据挖掘

统计、机器学习和数据挖掘
EN

Stack Overflow用户
提问于 2011-09-21 15:21:14
回答 3查看 2.1K关注 0票数 1

我目前正在学习数据挖掘,我有以下问题。

  1. 机器学习和数据挖掘之间的关系是什么?
  2. 我发现许多数据挖掘技术都与统计相关,而“听说”数据挖掘与机器学习有很多关系。所以我的问题是:机器学习与统计学密切相关吗?
  3. 如果它们不是密切相关的,那么是否有这样的分工,将侧重于统计技术的数据挖掘与以机器学习技能为重点的数据挖掘分开?因为我发现一些研究生院的统计学系开设了数据挖掘课程。
EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2011-09-21 15:36:45

数据挖掘是从数据中提取有用信息的过程,如模式、趋势、客户/用户行为、喜欢/不喜欢等,这涉及到人工智能和统计学相关算法的使用。

维基百科对数据挖掘的定义是:

数据挖掘( Data )(数据库过程中的知识发现的分析步骤,1或KDD)是计算机科学一个相对年轻的跨学科领域,2是从大数据集中发现新模式的过程,涉及到统计学和人工智能的方法,也包括数据库管理。相对于机器学习,重点在于发现以前未知的模式,而不是将已知的模式推广到新的数据。

机器学习包括让计算机“学习”那种行为、趋势等,并按此行事。例如,在信用卡欺诈中,计算机“了解”客户的行为,如果发生了一些奇怪的事情(涉及很高金额的交易等),计算机就会将该交易标记为潜在的欺诈行为。

维基百科对机器学习的定义是:

机器学习是人工智能的一个分支,它是一门涉及设计和发展算法的科学学科,它允许计算机根据经验数据(如传感器数据或数据库)来进化行为。机器学习是指在表示统计现象不完全信息的观测数据的基础上,通过归纳推理实现机器学习的算法的发展。分类也被称为模式识别,是机器学习中的一项重要任务,通过它机器“学习”自动识别复杂的模式,根据不同的模式区分样本,并做出智能决策。

机器学习使用数据挖掘来学习模式、行为、趋势等,因为数据挖掘是从一组数据中提取这些信息的方法。数据挖掘和机器学习都使用统计进行决策。因此,统计是非常重要的,在数据挖掘和机器学习中是非常重要的。

票数 4
EN

Stack Overflow用户

发布于 2011-09-21 15:25:26

不同的人所称的机器学习、数据挖掘和统计之间往往有很多重叠。这些术语的定义将取决于你问谁。

这是一个不错的概述,有很多很好的链接。

票数 3
EN

Stack Overflow用户

发布于 2022-03-25 17:21:51

虽然数据挖掘和机器学习之间存在重叠,但我们可以区分它们;简单来说,例如:数据挖掘搜索用于预测和/或描述海量数据的模式,机器学习将进一步利用这些模式来学习。两者都是基于统计数据的。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/7502337

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档