我有一个CSV文件,其中有两列,如下所示:
教育-婚姻
小学?
中学
中学
第三级?
初级
高等教育
诸若此类。列位于数据集中的第3和第4位置。我想找出有多少人受过高等教育,也结婚了。我做这件事有两种方式。第一,
with(bank.df, table(education, marital))然后注意到表中显示的数量。然后我用
sum((bank.df[4]== "married" & bank.df[3]== "tertiary"))只给了我一个号码。有没有其他更简单的方法可以让我实现同样的目标?
发布于 2020-09-23 23:10:27
该表为您提供了所有的组合,您可以轻松地选择所需的单元格,但如果要对列/值进行许多不同的组合,则可以创建一个简单的函数,为任何组合提供计数:
getcount <- function(x, col1, val1, col2, val2) {
sum((bank.df[, col1] == val1 & bank.df[, col2] == val2))
}
getcount(bank.df, "marital", "married", "education", "tertiary")
# [1] 1https://stackoverflow.com/questions/64037106
复制相似问题