搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏AILearning
Apache Spark 2.2.0 中文文档 - SparkR (R on Spark) | ApacheCN
74 4440 Run a given function on a large dataset grouping by input column(s) and using gapply or gapplyCollect（在一个大的 dataset 上通过 input colums（输入列）来进行 grouping（分组）并且使用 gapply or gapplyCollect 来运行一个指定的函数） gapply 应用给一个函数到 SparkDataFrame 的每个 group. schema <- structType(structField("waiting", "double"), structField("max_eruption", "double")) result <- gapply 5.033 ##4 87 5.000 ##5 63 4.933 ##6 89 4.900 gapplyCollect 像 gapply
3K50发布于 2018-01-05