我正在尝试在R中做一个"group by“风格的加权均值。使用一些基本的均值,下面的代码(使用Hadley的plyr包)工作得很好。
ddply(mydf,.(period),mean)如果我对weighted.mean使用相同的方法,我会得到以下错误"'x‘和'w’必须具有相同的长度“,这是我不能理解的,因为weighted.mean部分在ddply之外工作。
weighted.mean(mydf$mycol,mydf$myweight) # works just fine
ddply(mydf,.(period),weighted.mean,mydf$mycol,mydf$myweight) # returns the erros described above
ddply(mydf,.(period),weighted.mean(mydf$mycol,mydf$myweight)) # different code same story我想编写一个自定义函数,而不是使用weighted.mean,然后将其传递给ddply,甚至使用子集从头开始编写一些新的东西。在我的情况下,希望这将是太多的工作,但应该有一个更聪明的解决方案与现有的。
如有任何建议,请提前向我咨询!
发布于 2010-07-19 05:44:01
使用匿名函数:
> ddply(iris,"Species",function(X) data.frame(wmn=weighted.mean(X$Sepal.Length,
+ X$Petal.Length),
+ mn=mean(X$Sepal.Length)))
Species wmn mn
1 setosa 5.016963 5.006
2 versicolor 5.978075 5.936
3 virginica 6.641535 6.588
> 这将计算Sepal.Length的加权平均值(按Petal.Length加权)和未加权平均值,并同时返回两者。
发布于 2010-07-19 10:01:39
使用汇总(或汇总):
ddply(iris, "Species", summarise,
wmn = weighted.mean(Sepal.Length, Petal.Length),
mn = mean(Sepal.Length))https://stackoverflow.com/questions/3277326
复制相似问题