如何在云基础设施即服务(IaaS)平台上使用Apache有效地处理给定的数据?我有一个6,000万多个数据集,我需要运行这些数据。
发布于 2022-06-30 07:36:19
同样的选择有很多种。在Azure中,您可以使用Synapse/Azure。在GCS中,您可以将Dataproc集群与云Composer.It一起使用,如果您能够提到整个场景,您的确切来源是什么(csv/RDBMS table/ it ),以及目标/接收器是什么,那么提供答案就更容易了
https://stackoverflow.com/questions/72811682
复制相似问题