首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >用空格替换编码中不支持的字符

用空格替换编码中不支持的字符
EN

Stack Overflow用户
提问于 2010-12-24 14:43:48
回答 1查看 227关注 0票数 1

我得到了utf8字符集的某些文本,现在我想将它转换成ASCII码,在ASCII码中不支持的字符应该用空格替换。我当前使用的代码是

代码语言:javascript
复制
  $input_encoding = mb_detect_encoding($toClean);
  mb_substitute_character("long");
  $encoded = mb_convert_encoding($toClean, "ASCII", "auto");

现在它在输出中显示了像"testU+2013ng“这样的字符,我希望这个U+2013替换为空格。我尝试使用下面的regilar表达式

代码语言:javascript
复制
$encoded = preg_replace("~U\+[\d\w]{4}~", " ", $encoded);

现在,它在输出中显示类似"Road‘+CB9 +CA4 +CAEU+“的文本。如何使用preg或其他工具删除所有不支持的字符。

EN

回答 1

Stack Overflow用户

发布于 2010-12-24 17:01:27

我看不出regex有什么特别的问题,但您可以将其简化为:

代码语言:javascript
复制
U\+\d{4}
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/4524676

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档