Nifi和Kafka现在都可以在Cloudera数据平台,CDP公共云中使用。Nifi擅长与所有事物交谈,Kafka是一种主流的信息总线,我只是想知道:
在CDP公共云中从Apache向Kafka生成/使用数据所需的最低步骤是什么?
理想情况下,我会寻找在任何云中工作的步骤,例如Amazon和Microsoft。
我对遵循最佳实践并与平台的默认配置一起工作的答案感到满意,但如果有常见的替代方案,这些也是受欢迎的。
发布于 2020-07-17 14:57:46
将来会有多种形式的因素可用,现在我假设您的环境包含一个带有NiFi的数据中心,以及一个带有Kafka的数据集线器。(如果两者都位于同一个数据中心,则答案仍然有效)。
先决条件
这些步骤允许您在CDP公共云中生成从NiFi到Kafka的数据
除非另有说明,否则我已经将所有内容保持在默认设置中。
卡夫卡数据中心集群中的:
broker1.abc:9093,broker2.abc:9093,broker3.abc:9093
In NiFi GUI:
GenerateFlowFile处理器PublishKafka_2_0,将其配置如下:GenerateFlowFile处理器连接到PublishKafka_2_0处理器并启动流这些是最小的步骤,在Cloudera文件中可以找到更广泛的解释。注意,最好的做法是显式地创建主题(这个示例利用Kafka的特性,它可以在生成主题时自动创建主题)。
这些步骤允许您在CDP公共云中使用来自Kafka的NiFi数据。
一次很好的检查,看看数据是否被写入卡夫卡,正在再次消费。
In NiFi GUI:
ConsumeKafka_2_0 ),将其属性配置为:就是这样,在30秒内,你应该会看到你发布给卡夫卡的数据现在又流入了NiFi。
完全披露:我是Cloudera的雇员,Cloudera是Nifi背后的驱动力。
https://stackoverflow.com/questions/62956604
复制相似问题