在我的df中有2列:
“验尸日期”及“死亡日期”
这两列都有很多NAs。也有可能有人去世了,从来没有做过贪心测试,或者有人做过贪欲测试,但从未去世。示例:
df <- data.frame(PatientID = c("3454","345","5","345","567","79"),
date_of_covid_test = c(2020-04-02, NA, NA, 2020-11-03, NA, 2020-12-05),
date_of_death = c(2020-05-03, 2000-03-01, 2000-01-01, NA, NA, NA), stringsAsFactors = F)我想在这句话的基础上增设一个专栏:
如果死亡日期发生在贪心测试日期之后=是,否则=否
预期的输出是:,只有3454病人才是真,其他的都是假的。
基本上,的要点是是要知道死亡是否发生在贪心测试之后,这将是一个事实。或者是假的。
我希望这是有意义的
正确的编码方法是什么?
谢谢!
发布于 2021-01-15 16:50:24
如果您确信您的列是日期格式的,则可以尝试以下操作:
library(dplyr)
df <- df %>%
mutate(
condition = ifelse(date_of_covid_test < date_of_death, "yes", "no")
)其中df是您的dataframe,date_of_covid_test和date_of_death是dataframe的列名。
它可以工作,但要确保日期的行为正确!
https://stackoverflow.com/questions/65740061
复制相似问题