我有一个spark作业,它从源s3://bucket/ source -1文件夹读取(使用结构化流式API),并写入s3://bucket/destination-1文件夹。检查点保存在s3://bucket/checkpoint-1。
现在,我希望从s3://bucket/source-2读取具有相同模式的数据(检查点位于s3://bucket/checkpoint-2),但我希望将其附加到相同的s3://bucket/destination-2文件夹中。有可能吗?
发布于 2021-05-01 18:29:38
是的,这当然可以写入到相同的位置。但是你需要考虑不同的事情,比如:
https://stackoverflow.com/questions/67344565
复制相似问题