首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在所有列中包含数字的数据帧的子集行。

在所有列中包含数字的数据帧的子集行。
EN

Stack Overflow用户
提问于 2017-07-07 14:03:33
回答 1查看 1.1K关注 0票数 2

我希望通过在所有列中保留具有数值的行来获取数据的子集,因此

代码语言:javascript
复制
>small
     0    16h    24h    48h
ID1  1    0      0   
ID2  453  254    21     12  
ID3  true  3     2      1
ID4  65    23    12     12

将会是

代码语言:javascript
复制
>small_numeric
     0    16h    24h    48h  
ID2  453  254    21     12  
ID4  65    23    12     1

我试过了

代码语言:javascript
复制
sapply(small, is.numeric)

但得到了这个

代码语言:javascript
复制
0      16h    24h    48h   
FALSE  FALSE  FALSE  FALSE 
EN

回答 1

Stack Overflow用户

发布于 2017-07-07 14:18:35

使用:

代码语言:javascript
复制
small[!rowSums(is.na(sapply(small, as.numeric))),]

给予:

0 16h 24h 48h ID2 453 254 21 12 ID4 65 23 12 12

这样做的目的是:

  • 使用sapply(small, as.numeric),可以将所有列强制为数字列。因此,非数字值被转换为NA-values。
  • 接下来,使用NA-values和rowSums(is.na(sapply(small, as.numeric)))计算rowSums(is.na(sapply(small, as.numeric)))的数量,这给出了一个数字向量[1] 1 0 1 0,并按行列出了非数字值的数量。
  • !否定这一点会给出所有列都有数值的行的逻辑向量。

使用的数据:

代码语言:javascript
复制
small <- read.table(text="     0    16h    24h    48h
ID1  1    0      0     
ID2  453  254    21     12  
ID3  true  3     2      1
ID4  65    23    12     12", header=TRUE, stringsAsFactors = FALSE, fill = TRUE, check.names = FALSE)

对于更新的示例数据,问题是具有非数字值的列是因素而不是字符。在这里,您必须按照以下方式修改上面的代码:

代码语言:javascript
复制
testdata[!rowSums(is.na(sapply(testdata[-1], function(x) as.numeric(as.character(x))))),]

这意味着:

0 16h 24h 48h NA ID2 ID2 46 23 23 48 ID3 ID3 44 10 14 22 ID4 ID4 17 11 4 24 ID5 ID5 13 5 3 18 ID7 ID7 4387 4216 2992 3744

额外解释:

  • 当将因子列转换为数字时,必须先将它们转换为字符。因此:as.numeric(as.character(x)).如果不这样做,as.numeric将返回因子级别的数字。
  • 我使用testdata[-1],因为我假设您不希望在数字值的检查中包括第一列。
票数 5
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/44972786

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档