亲爱的,
我正在考虑如何在给定的通用数据中心体系结构中正确地使用Streamset:
我没有使用Streamsets进行进一步的处理,并且依赖Spark流进行可伸缩的复杂转换,这不是SLA管理的一部分(因为Spark不是从StreamSets内部触发的),我也不能在此设计中使用来验证JSON模式,而且JSON模式是基于嵌入到StreamSets中的定制逻辑作为Javascript进行验证的。
在上面的设计中,还有什么可以做得更好?
提前谢谢..。
发布于 2018-07-11 01:03:54
你的管道设计看起来不错。
不过,我建议使用Striim合并其中的几个步骤。
你可以在这里试试:
https://striim.com/instant-download
完全披露:我是Striim的一名首相。
https://stackoverflow.com/questions/50800157
复制相似问题