我试图运行交叉表/应急表,但需要通过加权变量对其进行加权。以下是一些样本数据。
set.seed(123)
sex <- sample(c("Male", "Female"), 100, replace = TRUE)
age <- sample(c("0-15", "16-29", "30-44", "45+"), 100, replace = TRUE)
wgt <- sample(c(1:10), 100, replace = TRUE)
df <- data.frame(age,sex, wgt)我运行这个是为了获得一个常规的交叉表
table(df$sex, df$age)为了获得加权频率,我尝试了Hmisc包(如果您知道更好的包,请告诉我)
library(Hmisc)
wtd.table(df$sex, df$age, weights=df$wgt)
Error in match.arg(type) : 'arg' must be of length 1我不知道我哪里出了问题,但它不能运行,所以任何帮助都会很好。或者,如果您知道如何在另一个包中这样做,这可能会更好地分析调查数据,这也将是很好的。在此之前,非常感谢您。
发布于 2020-10-06 14:21:29
发布于 2020-10-06 14:20:37
一个解决方案是按权重重复data.frame的行,然后table结果。
下面重复data.framework的行(只有相关的列):
df[rep(row.names(df), df$wgt), 1:2]它可以用来得到应急表。
table(df[rep(row.names(df), df$wgt), 1:2])
# sex
#age Female Male
# 0-15 56 76
# 16-29 73 99
# 30-44 60 106
# 45+ 76 90发布于 2021-09-03 07:55:29
基数R (以stats为单位)的xtabs正是用于这一点的:
xtabs(wgt ~ age + sex, data=df) https://stackoverflow.com/questions/64227592
复制相似问题