我对“数据科学”( Data )--也就是相对较新的、有些夸张的领域--非常天真,目前这个领域非常受欢迎。但我对数据并不天真..。作为一名科学家和研究人员,我过去曾以不同的角色与各种不同的人共事过。
现在我陷入了一个可悲的境地:我挖了许多浅浅的洞,使用了不同的软件系统和不同的数据类型,而且在任何事情上都没有真正的专业能力。
我的问题是,如果我想“跟上”数据科学,或者利用我有过的不同经验,我该如何处理呢?理想情况下,我希望使我的研究技能市场化--也就是说,成为某种类型的数据科学家,但更多地强调研究/报告方面。
假设我是白手起家,但已经证明了我的能力-我说这是因为,例如,我以前在一些项目中使用过R,但在休息一年左右之后,我每次都需要重新学习它.我从哪里开始,如何将所有这些零碎东西统一起来?
我能在这个领域做什么工作呢?(我做过各种各样的数据,从千兆字节的气候数据和地球科学,到健康注册,到纵向调查.但没有一个是以数据科学家的名字命名的)。
具体来说,我应该学习什么工具(S),我需要掌握什么理论?(请记住,我所有的编码和统计能力都是自学的。)
与这个(引人入胜的)问题不同的是,我没有业务背景,也不一定想走上业务分析师之路--我仍然想玩心理学(地球科学)或社会数据。我也不太想在数据管理方面工作--我希望数据库和编码是一种手段,而不是目的。最后,我不太倾向于理论和数学。也许总结我的倾向和立场的最好方法是,我不想成为一名数据科学专家,而是希望能够通过数据科学成为某一学科的专家。
我的倾向也许是专注于类似Python的东西,并使用它来利用R和其他功能?
我以前用过的工具(按曝光顺序排列)-
有一件事我发现,我现有的能力并没有为我提供一个有用的工具来把不同的数据整合到我想要分析的状态(我想是ETL?),因此我倾向于重新学习Python。
谢谢你的想法!
发布于 2016-10-02 18:12:38
Udacity数据分析员纳米度非常温和地介绍了使用Python进行大部分探索性数据分析,我认为这正是您要寻找的。(它不是为业务分析量身定制的。这些课程是免费的,你可以选那些你认为有趣的课程。在您的例子中,我将跳过有关使用javascript进行数据可视化和与MongoDB进行数据争论的内容。)THey提供了大量的资源。当然还有很多其他的在线课程。
如果你对书更感兴趣,你可以看看图基的探索性数据分析。一部仍然具有高度相关性的经典作品。
就工具而言,最常用的是R和Python,我现在将重点放在它们上。
https://datascience.stackexchange.com/questions/14313
复制相似问题