文章/答案/技术大牛

发布

社区首页 >问答首页 >在线代码编辑器Scastie如何读取输入文件？

问在线代码编辑器Scastie如何读取输入文件？
EN

Stack Overflow用户

提问于 2020-09-01 05:33:26

回答 1查看 317关注 0票数 0

我需要将一个非常大的输入文件传递给斯卡斯蒂。我的意思是，作为在线代码编辑器的Scastie如何读取本地机器上可用的文件，例如

val lines = sc.textfile("....mdb/u.data")

scala

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-09-01 06:04:52

有些人在团队的吉特频道上问了这个问题。

这位Scastie团队成员首先询问文件有多大，然后建议将它放在Github上的要旨中，并使用原始url读取它。

这只适用于小文件。Gist上文件的限制在其开发人员指南中得到了解释。

如果需要文件的全部内容，可以向raw_url指定的URL发出GET请求。需要注意的是，对于大于10 to的文件，需要通过git_pull_url提供的URL克隆gist。

所以10 MB是你的极限。还请注意，如果不将库标识为联机环境，就不能使用SparkContext(在问题中由sc表示)。

为此，您必须添加SBT依赖项。

导航到接口左侧的Build Settings。
将Scala Version设置为与我们将选择的Spark兼容的版本，在本例中为2.11.12。
在Extra Sbt Configuration下放置以下依赖项：

    libraryDependencies ++= Seq(
       "org.apache.spark" %% "spark-core" % "2.4.3",
       "org.apache.spark" %% "spark-sql" % "2.4.3"
    )

您将无法直接使用sc.textFile读取url内容，这仅用于读取本地/HDFS文本文件。您必须先获取内容，然后将其调整为形状，并从中获取一个DataFrame。

这里给出的答案描述了如何使用Standard中的来源访问web url。

根据OP的要求，这里有一个关于scastie的实现。

票数 4

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/63681906

复制

相似问题

问在线代码编辑器Scastie如何读取输入文件？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在线代码编辑器Scastie如何读取输入文件？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在线代码编辑器Scastie如何读取输入文件？
EN