首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >R删除以U开头的标记

R删除以U开头的标记
EN

Stack Overflow用户
提问于 2016-10-23 04:49:05
回答 2查看 167关注 0票数 1

如何删除句子中存在的像<U+0924><U+0930><U+0938><U+0902><U+0917><U+0924>这样的标记。Via- <U+0924><U+0930><U+094D><U+0915><U+0938><U+0902><U+0917><U+0924> - Tarksangat ~<U+0938><U+092F><U+094D><U+092F><U+0926> <U+092E><U+0902><U+095B><U+0930> <U+0907><U+092E><U+093E><U+092E>

我需要输出:Via- Tarksangat

有谁可以帮我?谢谢!

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2016-10-23 05:00:48

希望这是有用的

代码语言:javascript
复制
ab <- unlist(strsplit(abc,"[[:punct:]]"))
ab <- gsub("[[:punct:]]|[0-9]","",ab)

ab <- paste0(ab[nchar(ab)>2],collapse="-")
[1] "Via- Tarksangat "

数据

代码语言:javascript
复制
abc <- "Via- <U+0924><U+0930><U+094D><U+0915><U+0938><U+0902><U+0917><U+0924> - Tarksangat ~<U+0938><U+092F><U+094D><U+092F><U+0926> <U+092E><U+0902><U+095B><U+0930> <U+0907><U+092E><U+093E><U+092E>"
票数 2
EN

Stack Overflow用户

发布于 2016-10-23 04:53:36

尝尝这个

代码语言:javascript
复制
<U.*?>

并替换为空字符串

探索

你可以试试这个:

代码语言:javascript
复制
re = /<U.*?>/
str = 'asdfasdf <U+0924><U+0930><U+0938><U+0902><U+0917> tsdfasf <U+0924> 1sadfasdf a2sdf 3sdafasdf <U+0924><U+0930>5<U+0938> 4asdfasdf <U+0902><U+0917><U+0924>'
subst = ''

result = str.gsub(re, subst)

# Print the result of the substitution
puts result
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/40199632

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档