首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何将两个Spark DataFrames写成原子红移?

如何将两个Spark DataFrames写成原子红移?
EN

Stack Overflow用户
提问于 2018-04-11 07:10:05
回答 1查看 165关注 0票数 1

我正在使用Databricks spark-redshift将DataFrames写到Redshift。我有两个DataFrames,它们被附加到两个不同的表中,但我需要它自动发生,也就是说,如果第二个DataFrame写不到它的表,我也需要撤销第一个。有没有办法做到这一点?

EN

回答 1

Stack Overflow用户

发布于 2018-05-03 08:58:57

解决方案是为每个目标表创建一个临时表。要将Spark结果写入数据库:

使用spark- (DELETE FROM staging_table)

  • Write (不是从事务中的临时表到目标表的atomic)

  • Atomically
  1. (对于Python使用redshift-sqlalchemy包)将数据框复制到临时表)清理临时表。

一次只能运行Spark应用程序的一个实例,即不能有两个作业同时写入临时表,否则生成的数据将无效。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/49764102

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档