我一直在使用从库(Tidyverse)中分离出来的函数来将值分隔到不同的列中:
45 (10, 89)
34有了守则:
dd %>% separate(a, c("x","y","z"), extra="drop") 我得到了我想要的
45 10 89
34但是现在,我的变量有了一种不同的格式,并且无法工作:
45% (10,89)
34%为什么在使用符号'%‘时不工作?
*编辑:好的,我知道为什么不工作,这是因为我的数据中的十进制符号:
4.5% (10/89)
3.4%
6.7%
7.8% (89/98)你如何处理小数与单独的函数?非常感谢!!
谢谢!
发布于 2017-10-26 17:14:36
我推断,当你说“不起作用”时,是因为百分之百的符号被移除了:
separate(data_frame(a=c("45 (10, 89)","34")), a, c('x','y','z'), extra="drop")
# Warning: Too few values at 1 locations: 2
# # A tibble: 2 × 3
# x y z
# * <chr> <chr> <chr>
# 1 45 10 89
# 2 34 <NA> <NA>
separate(data_frame(a=c("45% (10, 89)","34%")), a, c('x','y','z'), extra="drop")
# Warning: Too few values at 1 locations: 2
# # A tibble: 2 × 3
# x y z
# * <chr> <chr> <chr>
# 1 45 10 89
# 2 34 <NA>来自?separate
分离(data,col,into,sep = "[^:alnum:]+",remove = TRUE,col= FALSE,extra = "warn",fill = "warn",.).
因为您没有覆盖默认的sep,所以它会找到任何不是字母或数字的东西。FYI,[^[:alnum:]]+类似于[^A-Za-z0-9]+,它匹配“不属于a、a或0-9字符范围的一个或多个字符”。
只要提供一个更详细的sep,你就能得到你想要的东西。
separate(data_frame(a=c("45% (10, 89)","34%")), a, c('x','y','z'), sep="[^[:alnum:]%]+", extra="drop")
# Warning: Too few values at 1 locations: 2
# # A tibble: 2 × 3
# x y z
# * <chr> <chr> <chr>
# 1 45% 10 89
# 2 34% <NA> <NA>编辑:使用最新的示例数据:
separate(data_frame(a=c("45% (10/89)","34%","","67%","78% (89/98)")), a, c('x','y','z'), sep="[^[:alnum:]%]+", extra="drop")
# Warning: Too few values at 3 locations: 2, 3, 4
# # A tibble: 5 × 3
# x y z
# * <chr> <chr> <chr>
# 1 45% 10 89
# 2 34% <NA> <NA>
# 3 <NA> <NA>
# 4 67% <NA> <NA>
# 5 78% 89 98https://stackoverflow.com/questions/46960046
复制相似问题