我有一串字符串看起来是这样的:
[3] " 3. Wiki: Los Angeles 3:58pm; score:1.959502"
[4] " 4. Wiki: Boston 6:58pm; score:1.959502"
[5] " 5. Disambiguation: 'Boon; score:1.934644"
[6] " 6. Wiki: The Note (album)\"; score:1.786931" 我将它们解析为这样的数据框架:
read.csv(text=sub("^ [0-9]*\\. (Wiki|Disambiguation): (.*); score:([0-9\\.]*)$","\"\\2\",\\3",ll),
header=FALSE,stringsAsFactors=FALSE)问题是,我在引号中包含的\\2文本可能包含引号(双引号和单引号)本身。
我该怎么处理呢?
发布于 2014-02-14 00:14:29
只需删除双引号:
ll <- gsub('"', '', ll)注:海报后更改的答案给出了一个如何出错的例子。
https://stackoverflow.com/questions/21768143
复制相似问题