首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >将所有表从redshift卸载到s3 - cpu使用率

将所有表从redshift卸载到s3 - cpu使用率
EN

Stack Overflow用户
提问于 2022-08-23 16:00:18
回答 1查看 127关注 0票数 0

我们的目标是每隔几个小时卸载几个表(针对每个客户),并以拼花格式将其卸载到s3

每个表约1GB (CSV格式),在拼花中约为120 is。

问题是当运行2-3个并行卸载命令时,红移节点的cpu在集群中达到98%-100%。

这是我使用的命令:

代码语言:javascript
复制
unload ('select * from my_table')
to 's3://test_bucket'
iam_role 'my_arn'
allowoverwrite
format PARQUET;

我也试图卸载数据作为CSV,但节点也转到了大约98%-100%的CPU。

我想每隔几个小时保存一次整个表的快照(几个表),而且我必须拥有所有的列,所以我必须使用select *

还有另一种方法可以让我的红移CPU不会提高这么高吗?

节点类型为ra3.xlplus,有4个节点。

EN

回答 1

Stack Overflow用户

发布于 2022-08-24 01:35:29

也许值得尝试一下,看看创建外部表在Amazon中是否运行得更快,然后使用插入(外部表)-将数据加载到其中?

您可以通过查看已经存在的内容来编写只插入增量数据的查询(如果行中有唯一标识符,则非常容易,或者增加时间戳)。否则,您将首先对外部表进行TRUNCATE,并将INSERT放入其中(但我还没有尝试过,因此我不确定TRUNCATE是否会在外部表上工作)。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/73461808

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档