我有一个大的数据框架(100列和250,000次观测),我试图同时获得数值的频率计数和每个变量的NAs。我尝试过使用table,但是数据对于函数来说太大了。对于如何获得这些数字,有什么建议吗?数据只包含NAs和数字1到5,因此,例如,对数据的一小部分浏览如下:
i1 i2 i3 i4 i5 i6 i7 i8
5 4 3 NA 3 4 3 NA
4 3 2 5 4 3 5 NA谢谢!
发布于 2015-11-16 20:40:24
我创建了一个包含5列和250,000行的数据格式,每一列都是从向量c(1:5,NA)中抽取的一个示例。我没有遇到像这样使用apply函数的问题:
new_df <- apply(df,2,table)我猜你是想把频率按列分解。如果您实际上想要整个数据帧的频率,可以对列执行上述的apply函数,然后执行另一个apply函数来对行进行求和,如下所示:
apply(new_df,1,sum)我的结果是这样的
1 2 3 4 5
167025 166677 166471 166849 166541 https://stackoverflow.com/questions/33743971
复制相似问题