我有一个包含国家清单的数据框架。像中国这样的国家的格式是“中国,人民共和国”。
例如。“刚果、民主共和国”、“马其顿共和国”等
对于这个格式的每个国家字符串,我想把它的名称和它的“标题”放在逗号周围,这样它就会像往常一样读起来,所以,
“刚果民主共和国”将改为“刚果民主共和国”。
谢谢。
发布于 2018-04-20 14:15:22
您可以使用sub和对正则表达式进行分组。每组括号构成一个组,可以用\\1、\\2等方法回忆。在本例中,我们用(\\w+)将第一个单词分组,并将其移到按(.*)分组的第二个或多个单词的组后面,并且不需要中间的逗号,因此它不包含在组中。
str <- c('Congo, Democratic Republic of the', 'Macedonia, Republic of', 'etc')
sub("(\\w+), (.*)","\\2 \\1",str)
# [1] "Democratic Republic of the Congo" "Republic of Macedonia" "etc" https://stackoverflow.com/questions/49943573
复制相似问题