首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >我可以只从scala-spark中的目录中读取想要的文件吗

我可以只从scala-spark中的目录中读取想要的文件吗
EN

Stack Overflow用户
提问于 2019-10-22 06:48:23
回答 1查看 337关注 0票数 2

我想读取一些名称在数组中的特定文件。我是否可以只在这些文件中读取和存储值。我是scala和spark的新手,请帮帮我。

整个文件

代码语言:javascript
复制
val status = fs.listStatus(new Path("..../sample/t1988")) 

status.foreach(x=> println(x.getPath))

file:/......../sample/t1988/01001099999.csv
file:/......../sample/t1988/01001399999.csv
file:/......../sample/t1988/01001499999.csv

诸若此类

我要读取的文件的名称在数组中

代码语言:javascript
复制
arr: Array[Any] = Array(42044099999, 42045099999, 42060099999, 42063099999, 42075099999, 42077099999, 42079099999, 42080199999

如何仅读取上述文件的内容

EN

回答 1

Stack Overflow用户

发布于 2019-10-22 12:51:39

如果您有一个包含csv文件路径的数组files,则可以使用Spark读取它们,如下所示:

代码语言:javascript
复制
val df = spark.read.format("csv").load(files:_*)
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/58495054

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档