最近,我使用了UDAF,查看了内置聚合函数collect_list的源代码,发现collect_list没有实现merge方法,尽管我认为这是非常直接的(只是连接两个数组)。从org.apache.spark.sql.catalyst.expressions.aggregate.collect.Collect获取的代码
override def merge(buffer: InternalRow, input: InternalRow): Unit = {
sys.error("Collect cannot be used in partial aggregations.")
}发布于 2018-02-15 11:28:41
https://stackoverflow.com/questions/48804856
复制相似问题