这是给http://cssfingerprint.com的
我有一个系统(详见网站页面):
visit)
H 112对于任何给定的测试,我只能查询许可。0.2%的空间
。
我需要一个算法来确定哪些功能(站点)最有可能有一个高的ROI查询(也就是说,更好地区分可信的-迄今为止的类别用户,并增加确定它是任何一个给定的)。
这需要平衡利用(基于先前的测试数据的测试)和探索(还没有经过足够的测试以了解它是如何执行的)。
有一个another question处理一个先验排名,这个是关于基于目前收集到的结果的后验排序。
现在,我没有足够的数据,我可以一直测试任何其他人曾经受到打击的一切,但最终情况不会是这样,届时这个问题将需要得到解决。
我认为这在人工智能中是一个相当标准的问题--对于那些昂贵的查询,有一个廉价的启发式方法--但是我的AI类并没有提到这个问题,所以我不知道是否有一个标准的答案。因此,相关的阅读
解决这个问题的好方法是什么?
发布于 2010-12-24 21:48:48
如果您对未采样的特性一无所知,那么在决定是探索还是利用您的数据时,您就没有什么可做的了。如果您可以在每次查询之后将ROI表示为单个数字,那么通过跟踪上置信度界限,有一种最佳的选择方法。见论文有限时间分析的多武器匪徒问题。
https://stackoverflow.com/questions/2424570
复制相似问题