首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >数据科学家的基本技能

数据科学家的基本技能
EN

Stack Overflow用户
提问于 2010-05-19 03:13:36
回答 11查看 16.6K关注 0票数 57

数据科学家的武器库中有哪些相关技能?随着新技术的不断涌现,人们如何挑选和选择要点呢?

以下是与此讨论相关的一些想法:

在NoSql和非关系型数据库出现之前,

  • 了解SQL和使用MySQL、PostgreSQL等数据库是很棒的。MongoDB、CouchDB等正变得越来越流行来处理web规模的数据。
  • 知道像R这样的统计工具就足以进行分析,但要创建应用程序,可能需要添加Java、Python和其他类似的工具。
  • 数据现在以文本、urls、多媒体的形式出现,关于集群计算、并行计算、云、亚马逊EC2、Hadoop ?
  • OLS回归现在有人工神经网络、随机森林和其他相对奇异的机器学习/数据挖掘算法。对于公司

有什么想法?

EN

回答 11

Stack Overflow用户

回答已采纳

发布于 2010-05-19 23:21:43

引用Hadley's phd thesis简介中的内容

首先,您以一种可以使用的形式获取数据...其次,您绘制数据以了解正在发生的情况……第三,您可以在图形和模型之间进行迭代,以构建简洁的数据量化摘要……最后,回顾您所做的工作,并思考将来需要哪些工具才能做得更好

步骤1几乎肯定会涉及到数据过滤,也可能涉及到数据库访问或web抓取。了解创建数据的人也很有用。(我将其归入“网络”一栏。)

第2步意味着可视化/绘图技能。

第3步意味着统计或建模技能。由于这是一个愚蠢的宽泛类别,将任务委托给建模师的能力也是一项有用的技能。

最后一步主要是软技能,比如内省和管理型技能。

问题中也提到了软件技能,我同意这些技能非常有用。Software Carpentry有一个很好的列表,列出了你应该拥有的所有基本软件技能。

票数 24
EN

Stack Overflow用户

发布于 2010-05-19 05:15:57

只是为了给其他人提供一些想法来阐述:

在某种可笑的高抽象级别上,所有数据工作都涉及以下步骤:

  • Data Manipulation/Synthesis/Modeling
  • Result Reporting
  • Story存储/检索
  • Data Collection
  • Data Telling

数据科学家至少应该在这些领域中的每一个领域都有一些技能。但根据专业的不同,一个人可能会在有限的范围内花费更多的时间。

票数 22
EN

Stack Overflow用户

发布于 2010-05-19 18:49:43

JD很棒,要更深入地了解这些想法,请阅读Michael Driscoll的优秀帖子The Three Sexy Skills of Data Geeks

  1. Skill #1: (Suffering)
  2. Skill #2:Data Munging #3:可视化(讲故事)
票数 13
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/2860314

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档