首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Python是如何在数据科学家中如此流行的?

Python是如何在数据科学家中如此流行的?
EN

Software Engineering用户
提问于 2022-02-12 21:39:21
回答 3查看 1.1K关注 0票数 10

我一直好奇为什么Python在数据科学家中如此受欢迎。

首先,我需要检查这个断言是否属实,因此我在StackExchange数据资源管理器上编写了一个查询:

https://data.stackexchange.com/stackoverflow/query/1555958/other-tags-on-python-posts

这显示了在python帖子(如numpy、matplotlib和tensorflow )中也可以找到的标签列表中常见的数据处理和分析工具。

我还检查了另一个方向,在标记为“数据-科学”的帖子中找到了其他最常见的标记:

https://data.stackexchange.com/stackoverflow/query/1555978/other-tags-on-data-science-posts

Python是这个列表中的第一位,所以我似乎在做一些事情。

为什么巨蟒在数据科学家中如此受欢迎?

EN

回答 3

Software Engineering用户

发布于 2022-02-12 21:54:35

简单的答案是,Python拥有两个最好的生态系统之一(以及R)的数据科学库。在(比如说) Java或C#中,没有任何东西与科学知识-学习具有类似的宽度。然后再加上一个事实,即所有的深度学习框架都与Python有绑定--当然,到了这个阶段,您已经在某种程度上进入了自增强的阶段,因为数据科学家使用Python,所以他们希望在Python中进行绑定。

像Python这样的高度动态的语言不适合检查正确性

我认为,这一说法表明了对Python数据科学生态系统工作方式的误解;绝大多数实际的“数学”不是用纯Python编写的(它太慢了),而是用C、C++甚至Fortran编写的本机代码。Python层只是顶部的一个薄薄的包装器,它在所玩的各种库之间进行协调。

(我正在努力避免进入动态和静态的flamewar;假设编写用Python检查正确性的代码是完全可能的)

票数 12
EN

Software Engineering用户

发布于 2022-02-13 00:43:54

我认为在这里分裂数据科学家和数据工程师是关键。数据科学家的角色是获取一个数据集,并计算出如何从中获得有趣和有价值的结果。他们主要不感兴趣的是使用该算法来获取这些结果,并构建一个使用该算法的产品。

由于数据科学家主要对算法感兴趣,所以代码可以被认为是为自己的使用而构建的一次性原型,只需要在初始开发的小范围内正确。它不应该被建造,以便其他人能够很容易地理解和修改它,而不需要冒险在将来多次破坏它。这显着地改变了演算,有利于那些可以以较低的初始开销(如脚本语言)而不是传统的软件开发过程手动尝试的工具。

如果您开始研究用于数据工程和大规模产品级数据处理的工具,您可能会发现scala和java是更大的参与者。

票数 5
EN

Software Engineering用户

发布于 2022-02-13 03:02:44

你说

我发现python在数据科学家中很受欢迎,这有点违背直觉,因为我认为对数据质量感兴趣的人也会对代码的质量感兴趣。

但是数据的质量与代码的质量没有任何关系,无论是性能、可读性、维护,这都不是数据科学家所需要的。

这类似于Perl因难以使用而获得的声誉。事实是,在这两种情况下,在正常使用中,代码实际上是不重要的,而且可能完全是短暂的。重要的是输出。

我不知道,所以我也没有写过任何python,但是我编写的Perl代码从未被保存过,只是在IDE中运行,并在窗口关闭时抛出而没有保存。

作为一个专业的程序员,或者我对代码质量的贡献,我不认为这会给我带来什么不好的影响。

票数 1
EN
页面原文内容由Software Engineering提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://softwareengineering.stackexchange.com/questions/436700

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档