问尝试将数据集拆分为案例和控件
EN

Stack Overflow用户

提问于 2021-05-11 04:25:29

回答 1查看 29关注 0票数 0

所以我有一个海量的数据集，我需要在其中找到病例和对照的描述性统计数据，然后能够对它们进行比较。例如，我有997名女性和1139名男性，但我需要知道有多少女性是病例，有多少是对照。Controls =0和cases = 1。我想保留所有其他变量，但只将它们分成两组。我试过使用split()函数，我试着创建一个subset()，但我仍然不知道如何让它向我显示不同的组。我对R比较陌生，但需要用它来分析我的硕士论文数据。

回答 1

Stack Overflow用户

发布于 2021-05-11 15:56:47

我不知道我是否理解得很好，但是如果您想根据一个条件拆分数据，那就非常简单了:因为您没有提供任何示例数据，所以我在一个虚拟的data.frame上放了一个示例

df <- data.frame(gender=sample(c("M","F"),1000,replace = T),control=sample(c(0,1),1000,replace = T),other.var=runif(1000))

control <- df[df$control==0,]
cases <- df[df$control==1,]

#if you want female control
f.control <- control[control$gender=="F",]
#idem for male control
m.control <- control[control$gender=="M",]
#idem for famale and male cases
f.cases <- cases[cases$gender=="F",]
m.cases <- cases[cases$gender=="M",]

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/67477257

复制

相似问题

问尝试将数据集拆分为案例和控件
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问尝试将数据集拆分为案例和控件EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问尝试将数据集拆分为案例和控件
EN