74 4440 Run a given function on a large dataset grouping by input column(s) and using gapply or gapplyCollect(在一个大的 dataset 上通过 input colums(输入列)来进行 grouping(分组)并且使用 gapply or gapplyCollect 来运行一个指定的函数 ) gapply 应用给一个函数到 SparkDataFrame 的每个 group. schema <- structType(structField("waiting", "double"), structField("max_eruption", "double")) result <- gapply 5.033 ##4 87 5.000 ##5 63 4.933 ##6 89 4.900 gapplyCollect 像 gapply