根据documentation的说法,jitter函数的解释是“向数字向量添加少量噪声”。
这是什么意思?
是否有一个随机数与向量中的每个数相关联并相加?
发布于 2013-07-09 23:20:45
抖动实际上意味着只是将随机噪声添加到数值向量中,默认情况下,这是通过从均匀分布中提取样本在jitter-function中完成的。如果未提供数量参数,则根据数据选择抖动中的值范围。
我认为术语“抖动”涵盖了除均匀分布之外的其他分布,它通常用于更好地可视化重叠值,例如整数协变量。这有助于掌握观察密度高的地方。最好在图形图例中指出某些值是否已经抖动,即使它是显而易见的。这是一个带有jitter-function以及正态分布抖动的可视化示例,其中我任意抛出了值sd=0.1:
n <- 500
set.seed(1)
dat <- data.frame(integer = rep(1:3, each=n), continuous = c(rnorm(n, mean=1), rnorm(n, mean=2), rnorm(n, mean=3))^2)
par(mfrow=c(3,1))
plot(dat, main="No jitter for x-axis", xlab="Integer", ylab="Continuous")
plot(jitter(dat[,1]), dat[,2], main="Jittered x-axis (uniform distr.)", xlab="Integer", ylab="Continuous")
plot(dat[,1]+rnorm(3*n, sd=0.1), dat[,2], main="Jittered x-axis (normal distr.)", xlab="Integer", ylab="Continuous")

发布于 2016-11-21 15:16:14
在R中回归模型的旋涡过程中可以很好地解释抖动效应以及为什么它是必要的。
它采用了弗朗西斯·Galton爵士关于父母和孩子身高关系的数据,并将其绘制在图表上,没有抖动,然后有抖动。
这是一个没有抖动的(plot(child ~ parent,galton)):

这是一个抖动(请忽略回归线) (plot( jitter (child,4) ~ parent,galton)):

这门课说,如果你没有抖动,许多人会有相同的高度,所以点落在彼此的顶部,这就是为什么第一个图中的一些圆圈看起来比其他圆圈更暗。然而,通过对孩子的身高使用R函数"jitter“,我们可以扩展数据来模拟测量误差,并使高频高度更明显。
https://stackoverflow.com/questions/17547699
复制相似问题