文章/答案/技术大牛

发布

问缺失值-热板邻居方法
EN

Stack Overflow用户

提问于 2011-05-30 18:39:28

回答 2查看 2.6K关注 0票数 5

我有一个R代码的问题，更确切地说，是缺少值的问题。实际上，我不知道如何使用简单的热板法来估算这些值。例如，拥有这些数据。

1  10000123  111  112820 0.24457235         NA        NA         NA         NA     11
2  10000132  111 2502357 0.19408587 0.19373610 0.6567305 0.01454520 0.13498823     69
3  10000388  111 4472360 0.14774927 0.14918678 0.6853377 0.05233508 0.11314044    106
4  10000792  111  666909 0.10520063         NA        NA         NA         NA     14
5  10002737  111 1139613 0.19944986 0.20114918 0.3564355 0.20135391 0.24106136     23
6  10002741  111  981574 0.11573570         NA        NA         NA         NA     13
7  10002929  111 1417192 0.08770932 0.08387991 0.6106012 0.11078473 0.19473415     24
8  10003396  111  444966 0.19026263 0.18784110 0.5215772 0.16844381 0.12213789     24
9  10003517  111 1230589 0.16393216 0.16358568 0.4614005 0.26670712 0.10830670     19
10 10003546  111  760847 0.12384748         NA        NA         NA         NA     10

使用第5列，需要找到最接近的值，然后在那些地方填充类似的受访者，其中是NA值。

谢谢。

回答 2

Stack Overflow用户

回答已采纳

发布于 2011-05-31 04:46:09

我从来没有使用过热的(或冷的)甲板采样。但是，稍微搜索一下，我就找到了rrp包中的rrp.impute函数。

下面是一个使用一些合成数据的简单示例：

install.packages("rrp")
require(rrp)
set.seed(1)
key <- 1:100
## create random values
value1 <- 10 + 2 * key + rnorm(100, 0, 10)
## make 5 values into NAs
missing <- sample( key, 5)
value1[missing] <- NA
## build a dataframe
df <- data.frame(key, value1)
## do a nearest neighbor hot deck interpolation
imputed <- rrp.impute( df )$new.data

## let's visualize this magic
plot( df)
points(missing, imputed$value1[missing], col="red")

这将使用默认值k=1，这正是我认为您想要的。结尾处的漂亮图片如下所示：

红色的圆圈是推测值，您可以看到它们只是最近的邻居。

票数 6

Stack Overflow用户

发布于 2011-05-30 20:14:44

我不知道是否有现成的R包，但下面的代码做到了：

dfr<-data.frame(c1=c(123,132,388,792,2737,2741,2929,3396,3517,3546),
 c2=c(0.244,0.194,0.47,0.105,0.199,0.115,0.087,0.190,0.163,0.123),
 c3=c(NA, 0.193,0.149, NA, 0.201, NA, 0.083,0.187,0.163,NA))

hdidx<-which(!is.na(dfr[,3]))
hd<-dfr[hdidx,]
md<-dfr[-hdidx,]
closesthd<-sapply(md[,2], function(curval){which.min(abs(curval-hd[,2]))})
md[,3]<-hd[closesthd,3]

在您的情况下需要的地方替换列号+可能采取另一个距离测量。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/6175217

复制

相似问题

问缺失值-热板邻居方法
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问缺失值-热板邻居方法EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问缺失值-热板邻居方法
EN