我想检查数组列的值是否等于"A“,而不使用"explode”或"UDF“,因为这会使我的DataFrame非常大,处理速度非常慢。
所以我有这个
+-----+----+--------------------+---------+
| Name| Age| Subjects| Grades|
+-----+----+--------------------+---------+
|[Bob]|[16]|[Maths, Physics, ...|[A, B, C]|
+-----+----+--------------------+---------+我想要这个
+-----+----+--------------------+---------+--------------------+
| Name| Age| Subjects| Grades| test |
+-----+----+--------------------+---------+--------------------+
|[Bob]|[16]|[Maths, Physics, ...|[A, B, C]|[true, false, false]|
+-----+----+--------------------+---------+--------------------+有什么解决方案吗?
先谢谢你。
发布于 2021-07-09 07:23:15
您可以使用SQL TRANSFORM来实现此目的。
import pyspark.sql.functions as F
df = df.withColumn("test", F.expr("TRANSFORM(Grades, x -> x = 'A')"))https://stackoverflow.com/questions/68309081
复制相似问题