数据科学家的武器库中有哪些相关技能?随着新技术的不断涌现,人们如何挑选和选择要点呢?
以下是与此讨论相关的一些想法:
在NoSql和非关系型数据库出现之前,
有什么想法?
发布于 2010-05-19 23:21:43
引用Hadley's phd thesis简介中的内容
首先,您以一种可以使用的形式获取数据...其次,您绘制数据以了解正在发生的情况……第三,您可以在图形和模型之间进行迭代,以构建简洁的数据量化摘要……最后,回顾您所做的工作,并思考将来需要哪些工具才能做得更好
步骤1几乎肯定会涉及到数据过滤,也可能涉及到数据库访问或web抓取。了解创建数据的人也很有用。(我将其归入“网络”一栏。)
第2步意味着可视化/绘图技能。
第3步意味着统计或建模技能。由于这是一个愚蠢的宽泛类别,将任务委托给建模师的能力也是一项有用的技能。
最后一步主要是软技能,比如内省和管理型技能。
问题中也提到了软件技能,我同意这些技能非常有用。Software Carpentry有一个很好的列表,列出了你应该拥有的所有基本软件技能。
发布于 2010-05-19 05:15:57
只是为了给其他人提供一些想法来阐述:
在某种可笑的高抽象级别上,所有数据工作都涉及以下步骤:
数据科学家至少应该在这些领域中的每一个领域都有一些技能。但根据专业的不同,一个人可能会在有限的范围内花费更多的时间。
发布于 2010-05-19 18:49:43
JD很棒,要更深入地了解这些想法,请阅读Michael Driscoll的优秀帖子The Three Sexy Skills of Data Geeks
https://stackoverflow.com/questions/2860314
复制相似问题