首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何在R中基于正则表达式对数据进行子集

如何在R中基于正则表达式对数据进行子集
EN

Stack Overflow用户
提问于 2015-01-21 15:42:33
回答 1查看 51关注 0票数 0

我有一个读取网址的数据框架。当我读url的时候,我得到了一些混合的数据。我想做两件事:

  1. 子集df,以便冒号中只包含CPU.Percent (有时由于某种原因,我需要删除这些列,因为某些原因,我需要删除这些列)。
  2. 冒号只应包括服务器名称,例如dc1server、dc1web等。

下面是我的数据框架df:

dput(df)

代码语言:javascript
复制
structure(list(Time = structure(1:2, .Label = c("1/13/2015", 
"1/14/2015"), class = "factor"), WEB..Linux..Total.CPU.Percent.Utilization.on.dc1server.Utilization = structure(1:2, .Label = c("3.67%", 
"3.75%"), class = "factor"), WEB..Linux..Total.CPU.Percent.Utilization.on.dc1web2.Utilization = structure(c(2L, 
1L), .Label = c("13.08%", "13.25%"), class = "factor"), WTAD..Linux..Virtual.Memory.on.dc1server1.Percent.Used = structure(c(2L, 
1L), .Label = c("9%", "9.42%"), class = "factor")), .Names = c("Time", 
"WEB..Linux..Total.CPU.Percent.Utilization.on.dc1server.Utilization", 
"WEB..Linux..Total.CPU.Percent.Utilization.on.dc1web2.Utilization", 
"WTAD..Linux..Virtual.Memory.on.dc1server1.Percent.Used"), class = "data.frame", row.names = c(NA, 
-2L))

1。

我试过这个:

代码语言:javascript
复制
data<-subset(df, grep("CPU.Percent", colnames(df))

没有用

2:

我试过:

代码语言:javascript
复制
colnames(df)<-gsub(colnames(df), grep(".(dc1.*).",colnames(df))

没有运气,知道我在这里做什么吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-01-21 15:54:19

正如阿克兰所说,

代码语言:javascript
复制
data <- df[, grepl("CPU.Percent", colnames(df))]

解决了第一个问题。

第二,试试这个

代码语言:javascript
复制
colnames(df) <- sub(".*\\.(dc[^\\.]*)\\..*", "\\1", colnames(df))

请注意,更改列名将改变第一段代码的工作方式。只要确保你按正确的顺序去做。

如果您先更改冒号,那么第一个问题解决方案将是:

代码语言:javascript
复制
data <- df[,2:3]
票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/28071183

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档