我有一个信息流的用户项目对,持有一个基于最后6M记录的块,并更新它每分钟。我不喜欢这些之间的重建,一些重要的数据可能是未使用的。例如,新用户加入了系统,但是模型还不知道他的情况。我发现了类PlusAnonymousConcurrentUserDataModel,,它允许向模型中添加少量条目并获得更精确的推荐。文档为它提出了更多限制使用的场景:我必须:
可以使用这个类迭代地收集数据直到模型被定时器重建吗?怎样才是正确的方法?PlusAnonymousConcurrentUserDataModel似乎有一些不同的用途。
发布于 2018-11-17 17:26:08
马赫特的这部分已经很古老了,有人反对。我认为它甚至不是在0.14.0版本中,您必须从源代码构建。
Mahout现在使用一种全新的技术来推荐。这种新算法称为相关交叉算法。您使用的旧方法没有像您所概述的那样使用实时输入。CCO可以推荐匿名用户,只要他们有某种形式的行为数据,这些用户还没有被内置到模型中。
实现CCO的体系结构需要DB中的数据存储和KNN引擎(搜索引擎)来进行模型查询。所有这些都打包在Apache PredictionIO + 通用推荐模板中。
社区对通用推荐本身的支持可以在这里找到:https://groups.google.com/forum/#!forum/actionml-user或其他项目的邮件列表。
https://stackoverflow.com/questions/52995966
复制相似问题