首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用样本号填充r dcast

使用样本号填充r dcast
EN

Stack Overflow用户
提问于 2017-02-22 09:46:24
回答 2查看 1.2K关注 0票数 1

我想知道是否有一种方法可以在使用dcast (库reshape2data.table)时用随机数对每个缺少的值进行fill。示例:

代码语言:javascript
复制
ID = c('AA', 'AA', 'BB', 'BB', 'CC', 'CC', 'CC', 'DD', 'DD')
Replica = c('H1','H3','H1','H2','H1','H2','H3','H2','H3')
Value = c(1.3, 2.5, 1.4, 3.7, 9.5, 7.4, 7.1, 1.8, 8.4)

example <- data.frame(ID=ID, Replica = Replica, Value = Value)

做一个简单的dcast

代码语言:javascript
复制
dfdc <- dcast(data=example, ID~Replica, value.var = 'Value', fill = sample(1:10, 1))

请注意一些值是如何遗漏的:

代码语言:javascript
复制
  ID  H1  H2  H3
1 AA 1.3  NA 2.5
2 BB 1.4 3.7  NA
3 CC 9.5 7.4 7.1
4 DD  NA 1.8 8.4

我想用随机数来填充这些缺失值,例如:

代码语言:javascript
复制
dfdc <- dcast(data=example, ID~Replica, value.var = 'Value', fill = sample(1:10, 1))

其结果是:

代码语言:javascript
复制
  ID  H1  H2  H3
1 AA 1.3 2.0 2.5
2 BB 1.4 3.7 2.0
3 CC 9.5 7.4 7.1
4 DD 2.0 1.8 8.4

但是,所有缺少的值都已被相同的随机数(在本例中为2)所替换。

是否可以将该函数单独应用于每个缺失值,从而用不同的随机数填充缺失值?

提前感谢!

EN

回答 2

Stack Overflow用户

发布于 2017-02-22 10:14:23

如果您不关心警告,您可以只执行fill = sample(10),未使用的值将被删除。你仍然会收到三个随机数。只需确保样本高于NA值的预期数量即可。

代码语言:javascript
复制
dcast(example, ID ~ Replica, fill = sample(10))
#   ID   H1  H2  H3
# 1 AA  1.3 4.0 2.5
# 2 BB  1.4 3.7 1.0
# 3 CC  9.5 7.4 7.1
# 4 DD 10.0 1.8 8.4
# Warning message:
# In ordered[is.na(ordered)] <- fill :
#   number of items to replace is not a multiple of replacement length

当然,您也可以简单地用suppressWarnings()包装它。

代码语言:javascript
复制
suppressWarnings(dcast(example, ID ~ Replica, fill = sample(10)))
#   ID  H1  H2  H3
# 1 AA 1.3 6.0 2.5
# 2 BB 1.4 3.7 5.0
# 3 CC 9.5 7.4 7.1
# 4 DD 9.0 1.8 8.4
票数 3
EN

Stack Overflow用户

发布于 2017-02-22 10:29:24

下面是一个使用tidyverse的选项

代码语言:javascript
复制
library(tidyverse)
complete(example, ID, Replica) %>%
    mutate(Value = coalesce(Value, as.numeric(sample(1:10, n(), replace=TRUE))))  %>%       
    spread(Replica, Value)
# A tibble: 4 × 4
#      ID    H1    H2    H3
#* <fctr> <dbl> <dbl> <dbl>
#1     AA   1.3   2.0   2.5
#2     BB   1.4   3.7   1.0
#3     CC   9.5   7.4   7.1
#4     DD   8.0   1.8   8.4
票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/42381232

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档