首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Scala foldLeft映射与文档的termCount

Scala foldLeft映射与文档的termCount
EN

Stack Overflow用户
提问于 2014-01-30 20:07:38
回答 1查看 345关注 0票数 0

我有一个文档列表,我希望在所有文档上找到(term -> termCount)对。我就是这样做的:

代码语言:javascript
复制
object termCount extends App {

  val docs = List(
    List("A", "B", "C", "C"),
    List("A", "D"),
    List("B", "B", "C"))

  val countsMap = docs.flatMap { ts =>
    val m = ts.map((_, 1)).groupBy(_._1)
    m.map { e => e._1 -> e._2.foldLeft(0)(_ + _._2) }
  }.groupBy(_._1)
    .map { e => e._1 -> e._2.foldLeft(0)(_ + _._2) }

  println(countsMap)

}

产出:

代码语言:javascript
复制
Map(D -> 1, A -> 2, C -> 3, B -> 3)

要把它分解成行动,我要做的是:

  • (term, 1)元组的生成 ts.map((_,1)).groupBy(_._1)
  • 计算文档-本地termCount e => e._1 -> e._2.foldLeft(0)(_ + _._2)
  • 生成文档的Map -本地(term -> termCount)条目
  • 在所有文档中将此映射还原为元组(term, termCount)
  • 也可以再次执行一个foldLeft来获取全局术语数。

我的问题是,如何使这段代码更简洁?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-01-30 20:30:44

这是相当简洁的:

代码语言:javascript
复制
scala> docs.flatten.groupBy(identity).map { case (k,vs) => (k,vs.size)}
res0: scala.collection.immutable.Map[String,Int] = Map(D -> 1, A -> 2, C -> 3, B -> 3)

帮助您完成原始代码的一件事是,您在两个不同的级别上执行相同的foldLeft操作:首先在每个子列表上,然后在整个过程中。相反,您可以将集合flatten到一个大列表中,因此只需执行一次:

顺便说一句:这里有一种foldLeft方式:

代码语言:javascript
复制
docs.flatten.foldLeft(Map.empty[String,Int]){ case (z,x) => z.updated(x, z.getOrElse(x,0) + 1) }
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/21466477

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档