我有这个Unicode序列:\u304a\u306f\u3088\u3046\u3054\u3056\u3044\u307e\u3059。如何将其转换为文本?
$unicode = '\u304a\u306f\u3088\u3046\u3054\u3056\u3044\u307e\u3059';我试过了:
echo $utf8-decode(unicode);我试过了:
echo mb_convert_encoding($unicode , 'US-ASCII', 'UTF-8');我试过了:
echo htmlentities($unicode , ENT_COMPAT, "UTF-8");但是这些函数都不能将序列转换为相应的日语文本。
发布于 2015-06-28 16:42:02
这里的问题是字符串不是unicode。它是一个转义序列,用于通过ASCII字符记录unicode (因此7位保存)。
这里有一个使用phps json解码器的简单技巧:
<?php
$sequence = '\u304a\u306f\u3088\u3046\u3054\u3056\u3044\u307e\u3059';
print_r(json_decode('["'.$sequence.'"]'));输出为:
Array
(
[0] => おはようございます
)这意味着您可以定义一个简单的便利函数:
<?php
$sequence = '\u304a\u306f\u3088\u3046\u3054\u3056\u3044\u307e\u3059';
function decode($payload) {
return array_pop(json_decode('["'.$payload.'"]'));
}
echo decode($sequence);您希望在有效负载中添加错误处理和特定于json的控制字符的转义。这个简单的例子只是给你指明了正确的方向……
玩得开心!
发布于 2015-06-28 17:03:48
intl扩展中的转译器类可以使用它的predefined Hex-Any identifier处理转换
$in = '\u304a\u306f\u3088\u3046\u3054\u3056\u3044\u307e\u3059';
$out = transliterator_create('Hex-Any')->transliterate($in);
var_dump($out); # string(27) "おはようございます"发布于 2017-07-06 19:39:18
PHP 7+
从PHP7开始,您可以使用Unicode codepoint escape syntax来完成此操作。
echo "\u{304a}\u{306f}\u{3088}\u{3046}\u{3054}\u{3056}\u{3044}\u{307e}\u{3059}";输出おはようございます。
https://stackoverflow.com/questions/31097636
复制相似问题