文章/答案/技术大牛

发布

社区首页 >问答首页 >Pandas将kruskal-wallis应用于数字列

问Pandas将kruskal-wallis应用于数字列
EN

Stack Overflow用户

提问于 2018-08-01 20:06:57

回答 1查看 2.9K关注 0票数 1

我有一个27列的数据帧(26列是数值变量，第27列告诉我每行与哪个组相关联)。总共有7组，我试图对每个变量应用Kruskal-Wallis检验，按组划分，以确定是否存在显著差异。

我试过了：

df.groupby(['treatment']).apply(kruskal)

这会抛出一个错误：“在stats.kruskal()中需要至少2组两组”。

我的其他尝试也没有产生输出。我将定期进行类似的分析，并使用更大的数据集。有没有人能帮我理解这个问题，以及如何解决它？

回答已采纳

发布于 2018-08-01 20:25:48

使用Scipy，您可以对每个变量执行以下操作：

scipy.stats.kruskal(*[group["variable"].values for name, group in df.groupby("treatment")])

票数 5

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/51632900

复制

相似问题

问Pandas将kruskal-wallis应用于数字列EN