我正在设置一台工作电脑,在这里可以自由支配。我典型的访问软件包都是免费的,比如Rstudio和Anaconda。
我曾考虑过投资于商业BI软件,如Tableau或Spotfire,但小组中没有其他人(或我自己)是一个熟练的用户。我还有其他明显的选择吗?
从一开始,这个小组的大部分工作将是探索性的。他们需要一些理由来进一步投资于“数据科学”。
发布于 2015-09-17 07:29:40
如果你是一名数据科学家,那么对预先打包的、通常是不灵活的商业工具几乎没有什么用处。
开放源码软件在数据科学中如此流行和有用的部分原因在于,你经常需要组合和/或修改一个程序来满足手头的需求--然后在没有一群律师和销售代表参与的情况下部署它。
由于数据科学家应该是熟练的程序员,所以您应该能够轻松地挖掘源代码并添加功能或使其更加友好。
我曾几次建议购买非免费产品(如GPL),结果发现一些勤劳的人在Git中建立了一个项目,该项目提供了商业软件(如果不是全部的话)的大部分功能。在没有的情况下,它至少解决了核心问题,我可以修改和扩展它。修改原型要比从头开始容易得多。
底线:小心数据科学的商业软件,除非你已经在开放源码软件领域做了你的尽职调查,并且可以诚实地说,你找不到任何可以修改以适应你的需要的项目。商业软件不仅不那么灵活,而且有效地与这些人建立了业务伙伴关系,这意味着您的命运在某种程度上是相互交织的(至少对于依赖于该软件的项目是如此)。
发布于 2015-09-17 00:58:38
如果你正在寻找一个技术包,我肯定会与数学。它有一个非常广泛的学科范围的功能,这是标准的(没有额外的软件包购买)。这允许您在成长过程中扩展到技术,而不必改变平台或购买额外的包。它也有一个很好的民防交互格式与一个免费和专业的读者。文档也是交互式的,这确实很有帮助。
但是,您必须对一些结构开放,在一起键入和链接函数,诸如此类。一旦你开始,它很快就来了。
发布于 2015-09-16 22:47:26
我会回音“大卫。问题是你期望这个工具能起什么作用。可能是SAS或SPSS的方法,甚至MATLAB。每个工具都会给桌子带来一些东西。取决于您需要什么,一个或多个可能符合要求。还请看一下您的组织的技术路线图。如果开源是一个很大的推动,你的列表可能会有所不同。
对于业务用户或技术水平较低的人来说,Tableau是一个很好的工具(而且易于学习)。尽管成本很高(单用户年度许可证的费用为2000美元),但它有一个很好的阅读器(免费),一旦生成报告,用户就可以利用阅读器进行更新,而无需依赖许可证持有人。只要报告的性质是稳定和规范的,就会有好处。
R具有强大的图形功能,因此参与分析的用户可能会发现它更适合。类似地,python可能是一个很好的工具,特别是当您需要一个基于web的解决方案时。
所以想想你的需求和策略。
https://datascience.stackexchange.com/questions/8105
复制相似问题