文章/答案/技术大牛

发布

社区首页 >问答首页 >火花放电/nested元素中的迭代数组

问火花放电/nested元素中的迭代数组
EN

Stack Overflow用户

提问于 2022-04-07 13:09:58

回答 1查看 200关注 0票数 0

我有input_data作为

[[2022-04-06,test],[2022-04-05,test2]]

input_data的架构是

 |-- source: array(nullable = true)                              
 |    |-- element: struct (containsNull= true)
 |    |    |-- @date: string(nullable = true)
 |    |    |-- user: string (nullable = true)

我将输出视为

+-----------+--------+
| date      | user   |
+-----------|--------+
|2022-04-06 |test    |
|2022-04-05 |test2   |
+--------------------+

我已经从input_data中创建了一个df，并在其上进一步应用了have，我正在考虑爆炸它的结果。

df.select(explode(df.source))

有什么更好的方法来实现输出的火花sql或火花df？

注意，在input_data中我得到的是@date而不是date，所以应用spark也是一个挑战。

pyspark

apache-spark-sql

apache-spark

回答 1

Stack Overflow用户

发布于 2022-04-07 13:19:47

使用select内联

df.selectExpr("inline(source)").show()

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/71782784

复制

相似问题

问火花放电/nested元素中的迭代数组
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问火花放电/nested元素中的迭代数组EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问火花放电/nested元素中的迭代数组
EN