我正在尝试构建一个推荐引擎,为此我正在考虑使用apache mahout,但我无法确定mahout是实时处理数据,还是在服务器空闲时对数据进行预处理,并将结果存储在数据库中的某个地方。
另外,有人知道像亚马逊、netflix这样的网站是怎么做的吗?
发布于 2013-05-20 20:26:09
两者之一/或,但不能两者都有。里面有一个旧项目的部分,本质上是中等规模的实时部分。还有一些基于Hadoop的实现都是离线的。这两者是没有关系的。
我是这些部分的主要创建者,如果您想要一个同时完成这两个功能的系统,我建议您查看我当前的项目Myrrix (http://myrrix.com)。
https://stackoverflow.com/questions/16645697
复制相似问题