在R语言中,我遇到了处理数据帧(test_dataframe)列(test_column)值的问题,如下所示:
列中的原始字符串:
test_column
6.77[9]
5.92[10]
2.98[103]我需要删除方括号和方括号中的任何字符,因此目标值如下:
test_column
6.77
5.92
2.98我试过用R语言的gsub函数,但是解决它不是很幸运,有人能帮我找出答案吗?
发布于 2019-12-09 06:01:43
我会用:
input <- c("6.77[9]", "5.92[10]", "2.98[103]")
gsub("\\[.*?\\]", "", input)
[1] "6.77" "5.92" "2.98"regex模式\[.*?\]应该匹配方括号中所有引用的术语,使用gsub将告诉R替换所有这些术语。
发布于 2019-12-09 06:01:14
您可以使用sub并删除方括号后的所有内容。
df$test_column <- sub("\\[.*", "", df$test_column)
df
# test_column
#1 6.77
#2 5.92
#3 2.98您可能希望将来自sub的输出包装为as.numeric。
如果前面总是有一个数字值,如本例所示,也可以使用parse_number
readr::parse_number(df$test_column)
#[1] 6.77 5.92 2.98数据
df <- structure(list(test_column = c("6.77[9]", "5.92[10]", "2.98[103]"
)), row.names = c(NA, -3L), class = "data.frame")发布于 2019-12-09 11:51:38
我们可以使用来自str_remove的stringr
library(stringr)
library(dplyr)
df %>%
mutate(test_column = str_remove(test_column, "\\[.*"))
# test_column
#1 6.77
#2 5.92
#3 2.98https://stackoverflow.com/questions/59243261
复制相似问题