我有一个27列的数据帧(26列是数值变量,第27列告诉我每行与哪个组相关联)。总共有7组,我试图对每个变量应用Kruskal-Wallis检验,按组划分,以确定是否存在显著差异。
我试过了:
df.groupby(['treatment']).apply(kruskal)这会抛出一个错误:“在stats.kruskal()中需要至少2组两组”。
我的其他尝试也没有产生输出。我将定期进行类似的分析,并使用更大的数据集。有没有人能帮我理解这个问题,以及如何解决它?
发布于 2018-08-01 20:25:48
使用Scipy,您可以对每个变量执行以下操作:
scipy.stats.kruskal(*[group["variable"].values for name, group in df.groupby("treatment")])https://stackoverflow.com/questions/51632900
复制相似问题