Apache Apex -是一个开源的企业级统一流和批处理平台。它用于GE Predix平台的物联网。这两个平台之间的主要区别是什么?
问题
发布于 2016-02-24 14:35:41
将其与Spark进行比较: Apache Spark实际上是一个批处理。如果您考虑Spark streaming (它在底层使用spark ),那么它就是微批处理。与此形成对比的是,Apache apex是一个真正的流处理。从某种意义上说,传入记录不必等待下一条记录进行处理。记录一到达就被处理并发送到下一级处理。
目前,为Apache Apex与机器学习库的集成添加支持的工作正在进行中,这些库包括Apache Samoa,Refer https://issues.apache.org/jira/browse/SAMOA-49
Python的https://www.datatorrent.com/blog/blog-writing-apache-apex-application-in-scala/,您可以使用Jython进行尝试。但是,我自己也不是没有试过。所以,对此不是很确定。考虑到它们是两个不同的处理引擎,
如果您有任何其他问题,对功能的请求,您可以将它们发布到apache apex用户的邮件列表中:https://mail-archives.apache.org/mod_mbox/incubator-apex-users/
https://stackoverflow.com/questions/35579783
复制相似问题