我想使用Kafka将数据从本地流式传输到云(S3)。为此,我需要在源机和云上安装kafka。但我不想把它放在云端。我需要一些S3连接器,通过它我可以与kafka连接,并将数据从本地传输到云。
发布于 2017-03-29 17:37:58
如果您的数据是Avro或Json格式(或者可以转换为这些格式),您可以使用Kafka Connect的S3连接器。请参阅Confluent's docs on that
如果你想通过Kafka移动实际(更大)的文件,请注意Kafka是为小消息设计的,而不是为文件传输设计的。
发布于 2018-09-04 23:32:53
有一个由Spreadfast的接收器和源连接器组成的kafka-connect-s3项目,它可以处理文本格式。不幸的是,它并没有真正更新,但仍然可以正常工作
https://stackoverflow.com/questions/43087384
复制相似问题