首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Apache-Spark: foreach中的方法不起作用

Apache-Spark: foreach中的方法不起作用
EN

Stack Overflow用户
提问于 2015-03-19 14:28:27
回答 2查看 1.9K关注 0票数 0

我从HDFS中读取了一个文件,该文件包含在JTS中表示envelopex1,x2,y1,y2

我想使用这些数据在foreach中构建STRtree

代码语言:javascript
复制
val inputData = sc.textFile(inputDataPath).cache()

val strtree = new STRtree

inputData.foreach(line => {val array = line.split(",").map(_.toDouble);val e = new Envelope(array(0),array(1),array(2),array(3)) ;
  println("envelope is " + e);
  strtree.insert(e,
  new Rectangle(array(0),array(1),array(2),array(3)))})

如您所见,我还打印了e对象。

令我惊讶的是,当我记录strtree的大小时,它是零!似乎insert方法在这里没有任何意义。

顺便说一下,如果我逐行编写一些测试数据的硬代码,就可以很好地构建strtree

还有一件事,这些项目被打包到jar中并在spark-shell中提交。

那么,为什么foreach中的方法不起作用呢?

EN

回答 2

Stack Overflow用户

发布于 2015-03-19 16:34:58

您将必须使用collect()来完成此操作:

代码语言:javascript
复制
inputData.collect().foreach(line => {
 ... // your code
})

你可以这样做(为了避免collect所有的数据):

代码语言:javascript
复制
val pairs = inputData.map(line => {
    val array = line.split(",").map(_.toDouble);
    val e = new Envelope(array(0),array(1),array(2),array(3)) ;
    println("envelope is " + e);
    (e, new Rectangle(array(0),array(1),array(2),array(3)))
}

pairs.collect().foreach(pair => {
    strtree.insert(pair._1, pair._2)
}
票数 1
EN

Stack Overflow用户

发布于 2015-03-19 16:08:59

使用.map()代替.foreach()并重新分配结果。

Foreach不返回应用函数的结果。它可以用来将数据发送到某个地方,存储到数据库,打印等等。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/29138425

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档