我正在开发一个基于Z评分(标准分数) score的热门话题查找系统.
我陷入了一个问题:
例句:我有两个话题:
我使用Z-得分来计算第4天的z值,这是两个主题,问题显示在这里:
如果对每个主题进行2次数据交互,则两个主题的z-得分几乎相同(0,66)(我的意思是对主题1使用10,20,20,20,20,20,20,200,200,200,200)。
但我如此困惑,这是正确的方式Z-得分工作,否则我必须包括所有的数据交互来计算。
发布于 2015-04-07 18:13:12
如果你将一个话题中的所有分数相乘以得到另一个主题的分数(在你的例子中,主题2的分数都是主题1分数的10倍),那么你计算的第4天的z分数对于两个主题都是一样的。无论如何,如果您想单独考虑每个主题,以便为一个主题找到重要的“热”天,那么学生的t分布t-distribution比简单的z-得分要好得多,因为t分布在根据样本的数量正确估计标准差时考虑了偏差。
https://stackoverflow.com/questions/29496127
复制相似问题