首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >将html实体转换为UTF-8,但保留现有的UTF 8。

将html实体转换为UTF-8,但保留现有的UTF 8。
EN

Stack Overflow用户
提问于 2015-07-10 10:16:27
回答 3查看 4.9K关注 0票数 2

我想将html实体转换为UTF-8,但是mb_convert_encoding破坏了已经被UTF-8编码的字符.正确的方法是什么?

代码语言:javascript
复制
$text = "äöü ä ö ü ß";
var_dump(mb_convert_encoding($text, 'UTF-8', 'HTML-ENTITIES'));
// string(24) "äöü ä ö ü ß"
EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2015-07-10 10:39:27

mb_convert_encoding()不是您想要实现的正确函数:您应该真正使用解码器(),因为它只会将实际的html实体转换为UTF-8,不会影响字符串中现有的UTF-8字符。

代码语言:javascript
复制
$text = "äöü ä ö ü ß";
var_dump(html_entity_decode($text, ENT_COMPAT | ENT_HTML401, 'UTF-8'));

这给

代码语言:javascript
复制
string(18) "äöü ä ö ü ß"

演示

票数 6
EN

Stack Overflow用户

发布于 2015-07-10 10:30:42

在我的本地主机上我得到了string(18) "äöü ä ö ü ß"

我想这和你的页面编码有关。使用Notepad++编辑文件,并从工具栏转到编码,并更改为'Encode in ANSI‘。如果它不工作,然后尝试‘编码在UTF-8没有BOM’。

票数 0
EN

Stack Overflow用户

发布于 2018-03-15 05:32:52

如果这还不起作用,试试这个

代码语言:javascript
复制
html_entity_decode($html, ENT_QUOTES, 'cp1252');

这是Windows IIS系统需要的东西才能正常工作。见来源

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/31338277

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档