首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Scala进口TSV

Scala进口TSV
EN

Stack Overflow用户
提问于 2014-11-04 21:55:48
回答 1查看 890关注 0票数 0

我在分析Scala中的TSV文件时遇到了一些问题。下面是对代码执行操作的代码。

代码语言:javascript
复制
var lines = file.map(_.split('\n'))
var nodes = lines.foreach( _.split('\t').map(_(1),_(2)).groupBy(_(1)).reduceByKey(_ + _))

输入

代码语言:javascript
复制
1 a 24
2 a 3
3 b 6

期望操作

代码语言:javascript
复制
a 27
b 6

我在执行拆分(‘\t’)时遇到了一个错误,理由是它不是ArrayString的成员,这是非常奇怪的,因为foreach中的_应该指每次只取一个元素。感谢你的帮助

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-11-04 22:51:01

首先,外汇的分配是单位,所以这不是你想要的。使用不变的数量。也不清楚什么是格式文件,所以您必须在那里得到一个字符串。

代码语言:javascript
复制
val file = "1\ta\t24\n2\ta\t3\n3\tb\t6" 

val lines = file.split("\n")
val nodes = lines.map(_.split("\t")).map(a => (a(1),a(2))).groupBy(_._1).map(a  => (a._1,a._2.map(b => b._2.toInt).sum))
//Map(b -> 6, a -> 27)

这是个大烂摊子,所以我试着把它分解一下:

代码语言:javascript
复制
val lines = file.split("\n")          //split string into array of lines
val nodes = lines.map(_.split("\t"))  //split each line into array of strings
  .map(a => (a(1),a(2)))              //get just the second two items from the array as a tuple
  .groupBy(_._1)                      //group by the first item in the tuple
  .map(a  => (a._1,a._2.map(b => b._2.toInt).sum))  //take each tuple and map the second value (an array of strings) into an array of ints and get the sum

如果您不喜欢最终输出的映射,可以使用toList轻松地更改它,或者将映射映射到您想要的任何东西。

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/26745781

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档