我确信,在这个论坛上将讨论的数据科学有几个同义词,或者至少是分析大量数据的相关领域。
我的特别问题是关于数据挖掘。几年前我上过数据挖掘研究生班。数据科学和数据挖掘之间有什么区别,尤其是我还需要看什么才能精通数据挖掘?
发布于 2014-05-14 07:56:34
@statsRus开始为您在另一个问题数据科学和统计之间的区别是什么?中的回答奠定基础:
数据挖掘可以看作是数据科学家工具包中的一个项目(或一组技能和应用程序)。我喜欢他用一种特定于行业的行话来区分采矿和收藏品的定义。
然而,我认为数据挖掘将是美国英语口语定义中数据收集的同义词。
到哪里去精通呢?我认为这个问题过于宽泛,因为它目前的说法,并将得到的答案,主要是基于意见。也许,如果你能完善你的问题,它可能会更容易看出你在问什么。
发布于 2014-05-19 00:09:17
@Clayton发布的信息对我来说似乎是对的,对于这些术语,以及“数据挖掘”这一数据科学家的工具来说,似乎都是正确的。然而,我并没有真正使用“数据收集”这个词,而且我也不认为它是“数据挖掘”的同义词。
我自己对你的问题的回答是:不,条件不一样。这个领域的定义可能比较松散,但我还没有看到这些术语可以互换使用。在我的工作中,我们有时用它们来区分目标或方法。对我们来说,数据科学更多的是为了检验一个假设,通常情况下,这些数据就是为了这个目的而收集的。数据挖掘更多地是对现有数据进行筛选,寻找结构,并可能产生假设。数据挖掘可以从一个假设开始,但它通常很弱或很笼统,而且很难用自信解决。(挖得够久,你就会发现一些东西,尽管结果可能是黄铁矿。)
然而,我们也使用了“数据科学”作为一个更广泛的术语,包括“数据挖掘”。我们还讨论了“数据建模”,对我们来说,这是基于数据以及其他知识和目标,为感兴趣的系统寻找模型。有时这意味着试图找到解释真实系统的数学模型,有时意味着找到一个对某一目的来说足够好的预测模型。
发布于 2014-06-19 16:07:29
我的回答是不。我认为数据挖掘是数据科学中的一个复杂的领域。数据挖掘主要考虑的是产生问题而不是回答问题。与数据科学相比,它通常被称为“探测新事物”,在数据科学中,数据科学家试图解决复杂的问题,以达到最终的结果。然而,这两个术语之间有许多共同之处。对于example..if,你有一个农业用地,你的目标是找到受影响的plants..Here,空间数据挖掘在这个过程中扮演着关键的角色,job.There是一个很好的机会,你可能最终不仅会发现土地上受影响的植物,而且它们在多大程度上是affected.......this,这是数据科学不可能实现的。
https://datascience.stackexchange.com/questions/14
复制相似问题