首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在一个因素的水平内选择一个随机样本,每个因素层大小不等。

在一个因素的水平内选择一个随机样本,每个因素层大小不等。
EN

Stack Overflow用户
提问于 2016-11-21 08:39:55
回答 1查看 2.2K关注 0票数 2

我想选择一个随机样本的数据在一个因素的水平。我可以使用ddply获得一个因子级别内的样本:

代码语言:javascript
复制
library(dplyr)
newdf <- ddply(iris, ~Species, function(x){
  ndf <- x[sample(nrow(x),2), ]
})
with(newdf,table(Species))

但是,我不想简单地从每个因素级别中抽取2个观测结果。相反,我想要抽样,比如说,2,3和4种观察,从物种的三个层次(即2种从刚毛,3种来自云杉色,4种来自处女)。我该怎么做?

我是否可以创建一个值的向量,例如c(2,3,4)被循环,每一个数据都被ddply分割?

需要指定向量中的值--它们不是所有数据的一致比例,也不是一致的数字。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-11-21 08:49:21

我们根据“物种”对数据集进行split,使用Map对观测数进行sample,并对list输出进行rbind

代码语言:javascript
复制
 do.call(rbind, Map(function(x,y) x[sample(y),], split(iris, iris$Species), 2:4))
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/40715863

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档