我需要了解何时使用卡夫卡连接与自己的消费者/生产者由开发人员编写。我们正在获得合流平台。此外,为了实现容错设计,我们是否必须从所有代理运行使用者/生产者代码( jar文件)?
发布于 2019-12-27 05:02:18
卡夫卡连接通常用于将外部源连接到卡夫卡,即produce/consume、、、外部源、、、Kafka。
你能用连接器做的任何事情都可以通过Producer+Consumer来完成
现成的连接器只方便将外部源连接到Kafka,而不要求开发人员编写低级代码。
需要记住的几点..。
如果源和接收器都是同一个connector.
发布于 2019-12-27 05:10:43
我们必须从所有代理运行消费者/生产者代码( jar文件)吗?
不要在经纪人上运行客户端代码。允许为代理进程保留所有内存和磁盘访问权限。
何时使用卡夫卡连接与自己的消费者/产品
根据我的经验,这些因素应予以考虑。
。
与原始的生产者/使用者APIs相比,Connect在容错方面的选择有限,但有更多代码的缺点,这取决于所使用的其他库。
注:汇合平台仍然是相同的Apache Kafka。
发布于 2019-12-30 06:08:42
卡夫卡连接:卡夫卡连接是一个开源平台,它基本上包含两种类型:Sink和Source。Kafka用于从获取/放置数据,从/到数据库到 Kafka。卡夫卡连接有助于使用卡夫卡的其他各种系统。它还有助于跟踪从DB到Kafka的更改(如答案之一Changed Data Capture (CDC) )。系统维护偏移量,以便从该特定偏移量读取/写入数据到Kafka或任何其他数据库。
有关更多详细信息,请参阅https://docs.confluent.io/current/connect/index.html
生产者/消费者:
生产者和消费者只是一个终端系统,它使用卡夫卡制作和消费主题之间的卡夫卡。当我们想要向消费群体中的不同消费者广播数据时,就会使用它们。这种系统还维护了消费者群体数据的滞后和抵消。
不,你不需要运行任何生产者/消费者运行卡夫卡连接。如果要检查是否有数据丢失,则可以在运行时运行使用者。如果使用Sink连接器,则可以通过运行Sink连接器的特定select查询在数据库中验证已经生成的数据。
https://stackoverflow.com/questions/59495694
复制相似问题