我有以下场景:
在N很大的地方(比如一百万),有一大堆东西可以推荐i1....iN。有几个类别: c1...cK。每个类别都由项目的子集组成。
用户可以转到显示来自给定类别的项目的页面。
我想显示每个类别页面的推荐项目给用户使用一个单一的强盗模型在所有类别的页面。因此,当我为类别页面ci请求一组top-K推荐(“操作”)时,结果应该仅限于ci中可用的项目集。
有没有办法用Vowpal Wabbit做到这一点?
发布于 2021-08-02 21:08:40
当您要求大众使用ADF (动作相关功能)表单提供上下文相关的强盗预测时,您可以指定可以为该预测选择哪些动作。ADF表单可以阅读更多关于here的内容,并与更常见的标准上下文bandit形成对比。这将允许您仅要求对当前正在查看的类别中的操作进行预测。这是因为动作被定义为组成它们的一组特征,因此您可以为每个预测呈现每个动作的任何一组特征。这意味着在调用之间更改操作不是问题。
然而,根据经验,我们看到使用> ~100个动作的上下文强盗并不是很有效。本质上,非常小的探索概率不能很好地与更新规则一起工作。
所以,这是可行的,但我不确定它会有多有效。
在这样的情况下,一种常见的方法是使用另一种模型来获取推荐池,然后使用上下文bandit作为L2排名器来个性化建议的50个左右的操作池。
https://stackoverflow.com/questions/68564264
复制相似问题