搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

2回答

在spark sql中注册UDAF

我想注册一个UDAF类(用Scala或Python编写)，并在Spark SQL中使用它。例如：// mock code:...然后我可以直接在spark sql中使用udaf，如下所示： spark.sql("select

浏览 2提问于2019-02-01得票数 1

1回答

我正在尝试通过PyFlink中的自定义UDAF调用外部函数。我使用的函数要求数据在字典对象中。我尝试使用row(t.rowtime, t.b, t.c).cast(schema)来达到这样的效果。在UDAF之外，这个表达式工作得很好。在UDAF中，此表达式被转换为InternalRow，而不能转换为字典对象。有没有办法强制使用Row而不是InternalRow？import row, col, lit, row_intervalfrom pyflink.ta

浏览 43提问于2021-06-18得票数 1

回答已采纳

1回答

配置单元计数不同的UDAF

我遇到了一个计算没有分组的count distinct的配置单元查询，它运行得非常慢。所以我想知道这个功能是如何在Hive中实现的，有没有UDAFCountDistinct来实现这个功能？

浏览 19修改于2020-09-17得票数 1

1回答

Apache Spark SQL中的moving median as a window function (UDAF)

我正在尝试在Scala中将其实现为UDAF。Spark的版本是1.6.1。我尝试了两种方式调用我的UDAF (“中位数”)：val timeSeries = ... // get a DataFrametimeSeries.registerTempTable有没有办法使用UDAF作为窗口函数？例如，计算移动中位数(不是移动平均值，而是中位数)。

浏览 2提问于2016-06-06得票数 2

1回答

SELECT UDAF(AGGR())中有奇怪的行为

您可以将strconcat()替换为您已有的任何UDAF。前一条语句按预期工作:它返回字符串'a'。

浏览 0提问于2018-08-27得票数 3

1回答

蜂巢计数不同的UDAF2

我在上读过：为了实现计数不同，蜂巢依赖于GenericUDAFCount。联合国非洲发展新议程没有专门为计数不同而实施。这些“不同的”键将是MapReduce混乱阶段的分区键的一部分，这样它们就很自然地被“区分”了。 select count(1) from (select id from tbl group

浏览 3提问于2020-01-23得票数 1

回答已采纳

1回答

表达式不在具有UDAF的GROUP BY键中

我的UDAF返回一个数组，但我得到的是一个SemanticException，所以这可能并不重要。ADD JAR udaf.jar; sum(i) i, myUDAF(f

浏览 1修改于2016-05-29得票数 0

1回答

将结构传递给spark中的UDAF

= true) |-- name: string (nullable = true) 如何将'cars‘结构传递给udaf

浏览 14提问于2019-02-04得票数 1

回答已采纳

1回答

Spark中UDAF与聚合器的性能比较

我正在尝试用Spark编写一些关注性能的代码，想知道我应该为数据帧上的汇总操作编写还是 (UDAF)。

浏览 10修改于2017-07-28得票数 3

3回答

在Scala中编写Spark UDAF以返回数组类型作为输出

我想为这个逻辑实现一个UDAF。我想把这个叫UDAF -+---+-------++---+-------+| 2|[D,A,C]|我正在尝试写一个UDAF

浏览 0修改于2018-04-05得票数 1

1回答

来自配置单元UDF / UDAF的JRI

我在一些数据节点上安装了R，并且可以编写Map reduce作业来通过JRI调用R。旧的mapred作业需要我先做-Dmapred.child.env="R_HOME=/usr/lib64/R"，然后才能工作。更广泛地说，这是从hive中成功完成的： sele

浏览 2修改于2013-05-30得票数 2

1回答

UDAF Spark中的多列输出

我从我的mongodb中获得了一些数据，如下所示： | view | data | | xx | *** | | xx | *** |没有必要知道里面是什么。class Extractor() extends UserDefinedAggregateFunction{

浏览 18修改于2017-03-13得票数 3

1回答

通过定义UDAF产生的Spark-sql错误

Spark version 1.6.0 on AWS EMR with Zeppelin Notebookimport org.apache.spark.sql.types

浏览 3修改于2016-03-07得票数 0

1回答

如何编写一个简单的行收集的Spark UDAF？

对于我的特定需求，我想编写一个UDAF，它只是简单地收集所有输入行。输入是两列行，双类型；返回的数据类型为ArrayList 我写了一个我的UDAF的“想法”，但我希望有人能帮我完成它。

浏览 1修改于2019-01-09得票数 4

回答已采纳

1回答

配置单元3.1.2 UDAF在Spark 3.0.0中不起作用

pyspark.sql.utils.AnalysisException: No handler for UDF/UDAF/UDTF 'org.apache.hadoop.hive.ql.udf.generic.GenericUDAFHistogramNumeric配置单元版本: 3.1.2 Spark版本: 3.0.0 如果有人在Spark 3.0.0中注册Hive UDAF时有一个适用于他们的简单代码片段，那也会非常有用

浏览 108修改于2020-09-17得票数 1

回答已采纳

1回答

ksqldb的自定义udaf函数是否保证并发(线程安全)？

我正在运行5个ksqldb实例(K8s)，每个实例线程(ksql服务器属性) num是3 我实现了udaf函数来聚合一个简单的map对象，使用这个udaf函数。

浏览 9提问于2022-03-29得票数 0

1回答

返回类型为复杂对象数组的Scala UDAF

我是Scala开发的新手，正在尝试解决以下问题：App > at org.apache.spark.sql.execution.aggregate.MutableAggregationBufferImpl.update(udaf.scalacom.turner.audiencematters.udf.RespondentPairUDF.update(RespondentPairUDF.scala:65) App &

浏览 0提问于2017-10-11得票数 2

1回答

如何将UDAF移植到聚合器？

在Spark 2中，我使用的UDAF是这样的： case class ColumnBuilderUDAF(channels: Seq[String]) extends UserDefinedAggregateFunction在Spark3中，UDAF被弃用，应该使用Aggregator。或者我仍然必须使用已弃用的UDAF？

浏览 30修改于2020-08-01得票数 0

回答已采纳

1回答

如何使用spark udaf实现条件窗口计数？

我有一个有列的表:时间戳、id和条件，我希望每隔一段时间(例如10秒)计算每个id的数量。非洲发展新议程的代码如下： public StructType inputSchema() { Arrays.asList( Dat

浏览 12修改于2022-02-08得票数 1

回答已采纳

1回答

collect_set等效火花1.5UDAF方法验证

有人能告诉我火花1.5中collect_set的等效函数吗？这种做法是否正确： new StructType().add("inputCol", colType) new

浏览 2修改于2016-10-12得票数 0

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页

点击加载更多

在spark sql中注册UDAF

PyFlink UDAF InternalRow与行

配置单元计数不同的UDAF

Apache Spark SQL中的moving median as a window function (UDAF)

SELECT UDAF(AGGR())中有奇怪的行为

蜂巢计数不同的UDAF2

表达式不在具有UDAF的GROUP BY键中

将结构传递给spark中的UDAF

Spark中UDAF与聚合器的性能比较

在Scala中编写Spark UDAF以返回数组类型作为输出

来自配置单元UDF / UDAF的JRI

UDAF Spark中的多列输出

通过定义UDAF产生的Spark-sql错误

如何编写一个简单的行收集的Spark UDAF？

配置单元3.1.2 UDAF在Spark 3.0.0中不起作用

ksqldb的自定义udaf函数是否保证并发(线程安全)？

返回类型为复杂对象数组的Scala UDAF

如何将UDAF移植到聚合器？

如何使用spark udaf实现条件窗口计数？

collect_set等效火花1.5UDAF方法验证

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐