首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >group by in R,ddply with weighted.mean

group by in R,ddply with weighted.mean
EN

Stack Overflow用户
提问于 2010-07-19 05:29:21
回答 2查看 12.9K关注 0票数 9

我正在尝试在R中做一个"group by“风格的加权均值。使用一些基本的均值,下面的代码(使用Hadley的plyr包)工作得很好。

代码语言:javascript
复制
ddply(mydf,.(period),mean)

如果我对weighted.mean使用相同的方法,我会得到以下错误"'x‘和'w’必须具有相同的长度“,这是我不能理解的,因为weighted.mean部分在ddply之外工作。

代码语言:javascript
复制
weighted.mean(mydf$mycol,mydf$myweight) # works just fine
ddply(mydf,.(period),weighted.mean,mydf$mycol,mydf$myweight) # returns the erros described above
ddply(mydf,.(period),weighted.mean(mydf$mycol,mydf$myweight)) # different code same story

我想编写一个自定义函数,而不是使用weighted.mean,然后将其传递给ddply,甚至使用子集从头开始编写一些新的东西。在我的情况下,希望这将是太多的工作,但应该有一个更聪明的解决方案与现有的。

如有任何建议,请提前向我咨询!

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2010-07-19 05:44:01

使用匿名函数:

代码语言:javascript
复制
> ddply(iris,"Species",function(X) data.frame(wmn=weighted.mean(X$Sepal.Length,
+                                                               X$Petal.Length),
+                                             mn=mean(X$Sepal.Length)))
     Species      wmn    mn
1     setosa 5.016963 5.006
2 versicolor 5.978075 5.936
3  virginica 6.641535 6.588
> 

这将计算Sepal.Length的加权平均值(按Petal.Length加权)和未加权平均值,并同时返回两者。

票数 17
EN

Stack Overflow用户

发布于 2010-07-19 10:01:39

使用汇总(或汇总):

代码语言:javascript
复制
ddply(iris, "Species", summarise, 
  wmn = weighted.mean(Sepal.Length, Petal.Length),
  mn = mean(Sepal.Length))
票数 20
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/3277326

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档