我们的目标是每隔几个小时卸载几个表(针对每个客户),并以拼花格式将其卸载到s3
每个表约1GB (CSV格式),在拼花中约为120 is。
问题是当运行2-3个并行卸载命令时,红移节点的cpu在集群中达到98%-100%。
这是我使用的命令:
unload ('select * from my_table')
to 's3://test_bucket'
iam_role 'my_arn'
allowoverwrite
format PARQUET;我也试图卸载数据作为CSV,但节点也转到了大约98%-100%的CPU。
我想每隔几个小时保存一次整个表的快照(几个表),而且我必须拥有所有的列,所以我必须使用select *。
还有另一种方法可以让我的红移CPU不会提高这么高吗?
节点类型为ra3.xlplus,有4个节点。

https://stackoverflow.com/questions/73461808
复制相似问题