首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏AILearning

    Apache Spark 2.2.0 中文文档 - SparkR (R on Spark) | ApacheCN

    74 4440 Run a given function on a large dataset grouping by input column(s) and using gapply  or gapplyCollect(在一个大的 dataset 上通过 input colums(输入列)来进行 grouping(分组)并且使用 gapply or gapplyCollect 来运行一个指定的函数 ) gapply 应用给一个函数到 SparkDataFrame 的每个 group. schema <- structType(structField("waiting", "double"), structField("max_eruption", "double")) result <- gapply 5.033 ##4 87 5.000 ##5 63 4.933 ##6 89 4.900 gapplyCollect 像 gapply

    3K50发布于 2018-01-05
领券