因此,我有一个学生数据集,我目前正在清理,我已经取得了数据框架的一个子集,并希望根据与特定专业关联的平均工资和非缺失值的实习数量来填充这个子集的工资列中的NAs。
所以如果我有:
subset(work_dat, (is.na(Employed) & outcome_table=="Employed - Full-time"), select=major, int_numb, salary)
Major Int_numb salary
<fctr> <dbl> <dbl>
Biochem 2 NA
Biosystems 2 NA例如,我想将生物化学和生物系统专业的平均工资替换为NA值,在本例中为2个实习。
Major Int_numb avg_salary
<fctr> <dbl> <dbl>
Biochem 2 70000
Biosystems 2 290000发布于 2019-03-16 02:46:43
您可以使用dplyr来实现这一点。如下所示:
library(dplyr)
work_dat %>%
group_by(Major) %>%
mutate(avg_salary = ifelse(is.na(avg_salary), mean(avg_salary, na.rm = T), avg_salary))https://stackoverflow.com/questions/55188925
复制相似问题