如何基于 Flink 生成在线机器学习的样本?
在线机器学习中,样本是关键的一环。本文将给大家详细的介绍微博是如何用 Flink 来实现在线样本生成的。
为何选择 Flink 来做在线的样本生成?
在线样本生成对样本的时效性和准确性都有极高的要求。同样对作业的稳定性及是否容灾也都有严格的指标要求。基于这个前提,我们对目前较为流行的几种实时计算框架(Storm 0.10, Spark 2.11, Flink 1.10)进行了分析比较,结论如下:
因此,我们决定使用 Flink 来作为在线样本生成的实时流计算框架。
如何实现?
在线样本生成,...