首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >用于数据科学应用的Scala (如RStudio / Spyder / Rodeo)

用于数据科学应用的Scala (如RStudio / Spyder / Rodeo)
EN

Stack Overflow用户
提问于 2016-12-06 11:47:58
回答 3查看 2.1K关注 0票数 5

随着Spark的兴起,Scala作为数据科学应用的首选编程语言,获得了巨大的发展势头。

为了提高数据科学应用程序的工作效率,已经发布了专用IDE

Scala也有类似的地方吗?

EN

回答 3

Stack Overflow用户

发布于 2016-12-07 18:43:47

不幸的是,目前似乎没有任何专用的Scala数据科学IDE。我认为这是你最好的选择:

IntelliJ工作表:

这基本上是一个文本编辑器,它有一个输出窗口,可以随时更新。Eclipse有类似的东西,我只是更喜欢IntelliJ。

Pros:

  • 在IntelliJ出色的代码完成、错误检查和sbt/maven集成的支持下。
  • 您可以在与实际开发系统相同的项目设置中进行原型(如果有)。

Cons:

  • 我不知道有任何缓存/选择性评估,所以每次您想要答案时都会对整个工作表进行评估,如果您有一些需要很长时间才能完成的操作,则可能不需要。
  • 没有工作区变量窗口或绘图集成。

木星笔记本

木星笔记本是iPython笔记本的一个推广,它现在支持数十种口译语言 (新内核一直在添加)。

Pros:

  • Scala火花Scala内核非常容易安装,它们都能够添加maven/sbt依赖项和JAR。
  • 笔记本中的细胞可以单独运行(例如,允许您训练一次模型并多次使用它)。
  • 单元格支持标记(使用LaTeX!)它可以自己呈现(github示例),允许您使用笔记本作为报告/演示。
  • 笔记本由笔记本服务器支持,因此您可以轻松地使用功能更强大的计算机作为您的笔记本服务器,然后从另一个位置与笔记本进行交互。
  • 有些内核具有自动完成功能。
  • 看起来有一些情节集成(示例),但它不是完全抛光。

Cons:

  • 并不是所有的内核都是完美的,有些有缺陷或者功能有限。
  • 没有工作区变量窗口。
  • 你真的需要小心你的细胞的排序,如果不这样做,可能会造成很多混乱。

对于我所做的大多数数据科学的东西,我使用木星,但它远不是完美的。为了让Scala真正成为一种数据科学语言,它确实需要更多的数据科学库(scikit-learn在这里遥遥领先),它需要一个坚实的绘图库(有几个选项,但我都没有看到它们都使用了惯用Scala,并且能够在没有服务器的情况下运行)。我认为,只要它有了这两个元素,它就会变得更受欢迎,希望有人能做出一个不错的RStudio。

票数 5
EN

Stack Overflow用户

发布于 2017-12-08 14:01:32

您最好的选择(不像rstudio,但这将是您对scala的最佳选择)是阿帕奇齐柏林

票数 4
EN

Stack Overflow用户

发布于 2020-05-27 05:53:08

我建议您查看用于Eclipse的Scala。但我认为,这真的取决于你个人的选择,在哪种情况下,你可以轻松地编写代码。为了按代码测试代码,我仍然会使用jupyter笔记本。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/40994642

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档