“消防水龙”或“红移”没有触发器，但是您可能会使用使用Lambda和Firehose的方法在插入数据之前对其进行预处理，如下所述：https://blogs.aws.amazon.com/bigdata/post/Tx2MUQB5PRWU36K/Persist-Streaming-Data-to-Amazon-S3-using-Amazon-Kinesis-Firehose-and-AWS-Lambda 在您的示例中，您可以将其扩展到在S3上使用Lambda，因为Firehose正在创建新文件，然后执行COPY/SQL。
另一种选择是编写自己的KCL客户端来实现Firehose的功能，然后在微批(500-1000行)复制后执行所需的更新。我已经完成了这样的实现(我们需要基于新记录来更新旧记录)，从一致性的角度来看，它可以正常工作，不过由于更新方面的红移性能不好，我建议总体上不要使用这种架构。根据我的经验，关键规则是Redshift数据是仅附加的，使用筛选器删除不必要的行(可选的定期剪枝，比如每天)通常比实时删除/更新这些行更快。
另一个本机警报是将Firehose数据转储到暂存表中，然后让计划好的作业接收该表中的任何内容，进行处理、移动数据和旋转表。

这已经实现了多次，并且运行良好。

票数 6

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/36295614

复制

相似问题

问有可能在S3和红移之间的移动消防软管？
EN

问有可能在S3和红移之间的移动消防软管？EN