我想要生成以下人工数据集来测试上下文bandit算法。在python中完成这个任务最简单的方法是什么?有没有人能给我指出一个演示代码的链接?
K个动作的单位向量θ1,...,θK从Rd均匀绘制。在T个完整迭代的每个迭代t中,首先从∥x|≤1内的均匀分布中采样上下文xt。
发布于 2015-05-14 14:11:04
如果我没理解错你的问题,你想生成:
,其中只有一个值被设置为1
这两个任务都可以通过numpy包轻松实现:
https://stackoverflow.com/questions/30229869
复制相似问题