所有人!我不是R方面的专家,但我有一些经验。但是,现在我不知道该怎么办。
我有数据帧,其中一些列应该转换为T-scale (T-scores with mean = 50和sd=10)。它的公式是50+10*(x-M)/SD。其中m是原始列的平均值,SD是原始列的标准差。
我有一个包含必要列名称的向量。我编写了cycle来转换我的数据。但是有些地方出了问题,在转换之后,我的数据看起来像是值逐渐减少的列。求求你救命!
我的代码:
mmpi <- c("L_SMOL", "F_SMOL", "K_SMOL", "Hs1SMOL", "D2SMOL", "Hy3SMOL", "Pd4SMOL", "Pa6SMOL", "Pt7SMOL",
"Se8SMOL","Ma9SMOL")
for (i in 1:11){
data.main[j,mmpi[i]] <- 50+10*((data.main[j, mmpi[i]]-mean(data.main[, mmpi[i]]))/sd(data.main[, mmpi[i]]))
}
}发布于 2020-08-22 04:32:05
在tidyverse中很容易做到这一点,我们可以在across中指定感兴趣的列,循环遍历这些列并执行scale/standardization
library(dplyr)
data.transformed <- data.main %>%
mutate(across(mmpi, ~ 50 + 10 * ((. - mean(.))/sd(.))))举个例子
head(mtcars) %>%
mutate(across(names(.)[1:3], ~ 50 + 10 * ((. - mean(.))/sd(.))))
# mpg cyl disp hp drat wt qsec vs am gear carb
#1 52.83069 50.00000 44.23453 110 3.90 2.620 16.46 0 1 4 4
#2 52.83069 50.00000 44.23453 110 3.90 2.875 17.02 0 1 4 4
#3 63.02119 34.18861 38.45053 93 3.85 2.320 18.61 1 1 4 1
#4 55.09525 50.00000 55.13516 110 3.08 3.215 19.44 1 0 3 1
#5 39.80951 65.81139 66.48071 175 3.15 3.440 17.02 0 0 3 2
#6 36.41268 50.00000 51.46454 105 2.76 3.460 20.22 1 0 3 1OP的代码显示行索引为j,列索引为i,而for循环仅循环列
发布于 2020-08-22 04:58:54
在base R中,您可以通过执行以下操作来完成此操作:
data.main[, mmpi] = 50 + 10 * scale(data.main[, mmpi])https://stackoverflow.com/questions/63529705
复制相似问题