我正在BigQuery中使用维基百科的公共数据集。我试图找到维基百科文章的in,其中字符计数排在第75、80、85和90百分位数。
我现在知道返回分位数的分位数函数,但是如何检索所有ID?
发布于 2014-02-27 06:14:57
不如:
SELECT a.id
FROM [publicdata:samples.wikipedia] a
CROSS JOIN (
SELECT NTH(75, QUANTILES(num_characters, 100)) amin, NTH(76, QUANTILES(num_characters, 100)) amax
FROM [publicdata:samples.wikipedia]) b
WHERE a.num_characters > b.amin AND a.num_characters < b.amax;你在用76,86,等等百分位数的ids做什么?您应该能够根据您的确切需求来调整前面的查询。
(为了提高效率,您应该将分位数查询结果提取到一个新的表中,而不是每次计算它--查询将运行得更快、更便宜)
https://stackoverflow.com/questions/22060430
复制相似问题