首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >函数返回星火中的空列表。

函数返回星火中的空列表。
EN

Stack Overflow用户
提问于 2015-12-09 12:22:01
回答 1查看 1.7K关注 0票数 3

下面是在压缩文件中获取文件名列表的代码

代码语言:javascript
复制
def getListOfFilesInRepo(zipFileRDD : RDD[(String,PortableDataStream)]) : (List[String]) = {
    val zipInputStream = zipFileRDD.values.map(x => new ZipInputStream(x.open))
    val filesInZip =  new ArrayBuffer[String]()
    var ze : Option[ZipEntry] = None
    zipInputStream.foreach(stream =>{
      do{
        ze = Option(stream.getNextEntry);
        ze.foreach{ze =>
          if(ze.getName.endsWith("java") && !ze.isDirectory()){
            var fileName:String = ze.getName.substring(ze.getName.lastIndexOf("/")+1,ze.getName.indexOf(".java"))
            filesInZip += fileName
          }
        }
        stream.closeEntry()
      } while(ze.isDefined)
      println(filesInZip.toList.length) // print 889 (correct)
    })
    println(filesInZip.toList.length) // print 0 (WHY..?)
    (filesInZip.toList)
  }

我以下列方式执行上述代码:

代码语言:javascript
复制
scala> val zipFileRDD = sc.binaryFiles("./handsOn/repo~apache~storm~14135470~false~Java~master~2210.zip")
zipFileRDD: org.apache.spark.rdd.RDD[(String, org.apache.spark.input.PortableDataStream)] = ./handsOn/repo~apache~storm~14135470~false~Java~master~2210.zip BinaryFileRDD[17] at binaryFiles at <console>:25

scala> getListOfFilesInRepo(zipRDD)
889
0
res12: List[String] = List()

为什么我没有得到889,而是得到0?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-12-09 12:38:13

之所以会发生这种情况,是因为员工之间没有共享filesInZipforeachfilesInZip的本地副本进行操作,当它完成时,这个副本就会被丢弃和垃圾收集。如果您想保留结果,您应该使用转换(很可能是一个flatMap)并返回收集到的聚合值。

代码语言:javascript
复制
def listFiles(stream: PortableDataStream): TraversableOnce[String] = ???

zipInputStream.flatMap(listFiles)

您可以从理解闭包了解更多信息。

票数 4
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/34178718

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档