您好,您可能知道Excel中有一个频率函数,如下所示:
=FREQUENCY(G3:G693,M683:M693) 它会将列数据重新分组到新的组中,并计算频率。
那么我如何在SQL Server的存储过程中做同样的事情呢?
非常感谢你的回复……
发布于 2014-06-27 08:09:56
您可以使用连接和仔细的聚合来完成此操作。将这两个表命名为Scores和Bins。下面是一个近似值:
select b.bin, count(s.score)
from Bins b left outer join
Scores s
on s.score <= b.bin
group by b.bin;它没有的一件事是“比其他一切都重要”组的最后一个bin。但是,通过正确选择bin限制,这可能就不是必要的了。而且,如果您需要该功能,请用full outer join替换left outer join。
编辑:
上面是累积频率。糟了。以下是正确的频率计算:
select b.bin, b.nextbin, count(s.score)
from (select b.*, (select min(b2.bin) from Bins b2 where b2.bin > b.bin) as nextbin
from Bins b
) b left outer join
Scores s
on s.score >= b.bin and (s.score < b.nextbin or b.nextbin is null)
group by b.bin, b.nextbin;边界也有类似的问题。解决这个问题的最简单的方法是选择好垃圾箱。(您可以在SQL中修复它,但这会使查询变得更加复杂。)
注意:在SQL Server2012+中,您可以用lead()函数替换相关子查询。
Here是解释该符号的frequency()函数的引用。
https://stackoverflow.com/questions/24441627
复制相似问题