首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >卡夫卡vs StreamSets

卡夫卡vs StreamSets
EN

Stack Overflow用户
提问于 2019-06-02 22:37:32
回答 3查看 2.9K关注 0票数 10

我读了一些关于卡夫卡和StreamSets的文章,我的理解是

  1. Kafka充当生产者系统和订阅者之间的中介。生产者将数据推送到Kafka
  2. StreamsSets集群中,订阅者从Kafka集群中拉出数据是一种通过管道将数据从一个源移动到另一个源的技术

现在,以下是我的问题,请帮助澄清

  1. 卡夫卡和StreamSets的根本区别是什么?是Kafka不移动数据而StreamSets移动数据吗?
  2. 如果Kafka不移动数据,Kafka用来做什么?如果它像ETL解决方案那样移动数据,那么它与SSIS、Informatica等有什么不同?
  3. StreamSets与SSIS、Informatica等有什么不同?
EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2019-10-01 02:34:07

1)在StreamSets中,大多数时候我们创建“数据管道”,把管道想象成一个应用程序,它可以由多个步骤/任务组成,第一个任务可以从数据库或kafka或任何数量的数据源读取数据,第二步可以修改数据,第三步可以运行脚本……最后,它可以将转换后的数据保存在一个目标中,该目标可以是数据库、AWS……Fafka和StreamSets可以一起工作,StreamSets可以从Kafka读取数据,也可以向Kafka写入数据

2)我认为Kafka是一个从多个来源收集数据的地方,并在一定时间内可供消费者使用。例如,Kafka可以定期从数据库表中读取,并将更改存储在“主题”中,定期从web服务中读取,然后将此数据存储到另一个主题中。这些主题现在对消费者可用,开发人员现在可以创建一个应用程序,从第一个主题读取数据并对数据做一些操作,Kafka可以使用偏移量跟踪消费者读取的内容,并提供复制和其他选项。它消除了编写集成多个源和目标的自定义代码的需要,相反,您可以配置此部分。

StreamSets可以对Kafka进行读写。StreamSets不会将数据存储在自己的系统中,而Kafka会将数据存储一段可配置的时间。

3) SSIS类似于StreamSets,因为它用于创建包含多个任务的管道/包,每个任务可以获取前一个任务的数据/结果,然后对其执行某些操作。StreamSets和SSIS都可以连接到多种数据源和目的地。

我个人对StreamSets和SSIS的不同之处的看法是:

  • StreamSets是基于web的,而SSIS需要Visual Studio,StreamSets图形用户界面更容易使用,并且不需要为每个StreamSets安装特殊的软件。
  • SSIS是一个微软产品,因此它与其他微软产品集成得很好。
  • 如果你想编写StreamSets脚本任务,你必须使用C#/DotNet。StreamSets脚本任务可以用Jython语言编写,JavaScript
  • 版本较旧,并且有大量的在线文档。
票数 3
EN

Stack Overflow用户

发布于 2019-06-02 23:39:49

StreamSets是一个图形化工具,它包含允许数据移动的组件,这些组件恰好包括Kafka生产者和消费者,但您不需要使用它们。

它们是互补的,通过使用Kafka,您可以允许流媒体系统中的背压,或者让非StreamSets生产者/消费者与其他Kafka主题进行交互。不,Kafka不移动数据(除了内部复制),与代理交互的客户端移动。

我没有用过Informatica或SSIS,但我相信如果你联系StreamSets的人,他们会回答他们的比较

票数 8
EN

Stack Overflow用户

发布于 2021-01-06 01:54:29

感谢所有人,我想我必须分享一些关于我们如何看待kafka和streamset之间的规范的想法,如果我们在同一个集群中使用两者,那么我们如何区分它们。

“因为我们使用Kafka的可靠性和Streamset的简单性”

数据漂移流集消除了生产者和Consumer

  • Streamset使用到一个源1个Destination

  • Kafka将数据从多个源转移到多个目标的编码开销(发布-订阅methodology)

  • Streamset消除了数据漂移问题
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/56416005

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档