首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >筛选表列并将其路由到不同的表(如果为null )

筛选表列并将其路由到不同的表(如果为null )
EN

Stack Overflow用户
提问于 2018-09-13 16:34:57
回答 1查看 29关注 0票数 0

我对SQL不太了解,但我还是想问一下这个论坛。

我的工作是处理带有空值的记录。我的意思是,我们有自然键(假设有4列),其中任何一列都会获取NULL值,那么应该将其路由到另一个表,以便将其报告给客户端。

AFAIK SQL只提供一个输出,不能分割。我们有没有办法在SQL/spark SQL中处理这个问题?我需要使用spark来执行这个任务。

工艺流程是:

  1. 第一个数据被定量化并保存在蜂巢表中。
  2. 我需要接受这些数据并检查空值。
  3. 将其存储在下一级表中。
EN

回答 1

Stack Overflow用户

发布于 2018-09-13 16:51:47

虽然你不能一蹴而就,但你可以按照上面提到的步骤去做。

在Hive中创建表之后,使用PySpark可以这样做,

代码语言:javascript
复制
#Set all the imports and enable Hive support for the session
#Dataframe to hold rows where either of 4 columns is null
df=spark.sql("select * from tblName where col1 is null or col2 is null or col3 is null or col4 is null")
#Write the resulting dataframe to a Hive table
df.saveAsTable('tableName') #Use other arguments in saveAsTable as required
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/52318128

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档