如果我理解得很好，您希望Kafka作为最终的后端来存储数据，而不是作为Flume代理用来通信源和接收器的内部通道。我的意思是，Flume代理基本上由接收数据和构建Flume事件的源组成，这些事件被放入通道中，以便接收器读取这些事件并对它们执行某些操作(通常，将这些数据持久存储在最终的后端中)。因此，根据您的设计，如果您使用Kafka作为内部通道，它将是一种内部方式，用于通信HTTP源和HDFS接收器；但它永远不会从代理外部访问。

为了满足您的需求，您将需要以下代理：

http_source -----> memory_channel -----> HDFS_sink ------> HDFS
            |
            |----> memory_channel -----> Kafka_sink -----> Kafka

{.................Flume agent.....................}       {backend}

请注意，基于内存的通道是内部通道，它们可以基于内存或文件，甚至在Kafka中，但Kafka通道将不同于最终的Kafka，您将持久化数据，并且将通过您的应用程序访问。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/32667179

复制

相似问题

问Flume使用案例:从HTTP读取并通过Kafka推送到HDFS
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Flume使用案例:从HTTP读取并通过Kafka推送到HDFSEN