从我的角度来看,我有一个相当棘手的任务:我有一个关于大众汽车的大型数据集。其中一列包含汽车型号。我只想有大众+模式(例如大众高尔夫或大众帕萨特)。我可以用gsub删除所有我不需要的东西,但在我看来这并不有效,可能需要50行代码。
解决这个问题的简单而有效的方法是什么?

发布于 2013-11-21 17:26:55
还不清楚您在gsub中尝试了什么,但我会这样做:
gsub('(^VW \\w+).*','\\1',modell)使用一些数据:
modell <- c('VW Caddy Life 1.6 ',
'VW Passat 3.2',
'VW Bora 2.8',
'VW Golf 1.4',
'VW Passat (Kombi)')
gsub('(^VW \\w+).*','\\1',modell)
[1] "VW Caddy" "VW Passat" "VW Bora" "VW Golf" "VW Passat"https://stackoverflow.com/questions/20127464
复制相似问题