据我所知,R和Python是两种最流行的数据科学语言。
我的问题是,对于刚开始从事数据科学的人,你会推荐哪一个?有谁比另一个有明显的优势吗?是更容易学习,还是谁有更大的潜力?
非常感谢!
发布于 2018-09-13 22:54:49
这是一个长期的争论。毫无疑问,Python的可读性更强,学习速度更快。这也是一种比R. R更通用的语言,另一方面,它有一些特殊的统计软件包,几乎所有你可以梦想做的事情。有一些统计数据可以实现Python没有库的功能(尽管我怀疑人们正在研究这个问题)。
在学习数据科学的早期阶段,更重要的是更基本的理论:数学、线性代数、微积分和统计学。与特定语言相比,掌握这些领域在学习过程中所占的比例要大得多。
话虽如此,但我碰巧更喜欢Python,因为它具有可读性。事实是,很多时候,其他人都需要跟在你后面读你写的东西。对于这一点,你有时必须阅读你自己的代码!可读性比用一行程序做奇妙事情的能力更重要。至于高级的统计数据,这在医学领域中是最常见的;在那里,你肯定会发现R比Python占优势。
发布于 2018-09-14 06:44:55
我想我们可能会给你无穷的答案,因为我们每个人都有不同的经历,不同的背景和故事。国际水文学组织,这个问题本身有一个严重的问题:为什么选择?你能在锤子和钉子之间做出选择,在墙上放一个框架吗?不,因为这两者都是工具,因为Python和R --显然,你只会开始学习其中的一种,但最后,我建议学习这两种工具,因为至少在今天,它们是互补的。根据我的经验(科学背景,处理能源和气候数据),Python在处理大型网格数据集方面非常出色,这要归功于xarray和快速计算;另一方面,当我需要“最后一英里”时,我使用R,即当我必须处理数据以可视化它(今天的ggplot2是进行数据探索和可视化的顶级库)并呈现它时( shiny库非常容易学习和有效)。但是,虽然R语法可能是丑陋和不一致的,但是Python非常优雅,而且绝对是一种现代的编程语言,当您需要使用OOP范式编写大量代码时,这是最好的解决方案。
所以问题是:我应该先学哪一个?这取决于:你为什么要学它?你已经有项目了吗?如果你仍然没有一个明确的想法,我会建议参加在Datacamp的第一个R和Python课程,然后选择从哪里开始。
https://datascience.stackexchange.com/questions/38226
复制相似问题