首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >UTF-8转UTF-16 to

UTF-8转UTF-16 to
EN

Stack Overflow用户
提问于 2014-06-24 06:09:15
回答 2查看 6.5K关注 0票数 7

我需要在javascript中将utf-8字符串转换为utf-16 the,就像iconv() php函数一样。

Ie:

代码语言:javascript
复制
iconv("UTF-8", "UTF-16LE", $string);

输出应该如下:

49 00 6e 00 64 00 65 00 78 00

我发现这个功能可以解码UTF-16LE,它工作得很好,但我不知道如何进行同样的编码。

代码语言:javascript
复制
function decodeUTF16LE( binaryStr ) {
    var cp = [];
    for( var i = 0; i < binaryStr.length; i+=2) {
        cp.push( 
             binaryStr.charCodeAt(i) |
            ( binaryStr.charCodeAt(i+1) << 8 )
        );
    }

    return String.fromCharCode.apply( String, cp );
}

其结论是创建一个可以下载的二进制文件。

守则:

代码语言:javascript
复制
function download(filename, text) {
    var a = window.document.createElement('a');

    var byteArray = new Uint8Array(text.length);
    for (var i = 0; i < text.length; i++) {
        byteArray[i] = text.charCodeAt(i) & 0xff;
    }
    a.href = window.URL.createObjectURL(new Blob([byteArray.buffer], {'type': 'application/type'}));

    a.download = filename;

    // Append anchor to body.
    document.body.appendChild(a);
    a.click();

    // Remove anchor from body
    document.body.removeChild(a);
}
EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2014-06-24 12:32:43

这应该可以做到:

代码语言:javascript
复制
var byteArray = new Uint8Array(text.length * 2);
for (var i = 0; i < text.length; i++) {
    byteArray[i*2] = text.charCodeAt(i) // & 0xff;
    byteArray[i*2+1] = text.charCodeAt(i) >> 8 // & 0xff;
}

它是decodeUTF16LE函数的逆函数。注意,这两种方法都不适用于BMP之外的代码点。

票数 7
EN

Stack Overflow用户

发布于 2014-06-24 16:05:02

非常感谢Bergi,它与标准的utf8到utf16编码函数完美地结合在一起:

代码语言:javascript
复制
function encodeUTF16LE(str) {
    var out, i, len, c;
    var char2, char3;

    out = "";
    len = str.length;
    i = 0;
    while(i < len) {
        c = str.charCodeAt(i++);
        switch(c >> 4)
        { 
          case 0: case 1: case 2: case 3: case 4: case 5: case 6: case 7:
            // 0xxxxxxx
            out += str.charAt(i-1);
            break;
          case 12: case 13:
            // 110x xxxx   10xx xxxx
            char2 = str.charCodeAt(i++);
            out += String.fromCharCode(((c & 0x1F) << 6) | (char2 & 0x3F));
            out += str.charAt(i-1);
            break;
          case 14:
            // 1110 xxxx  10xx xxxx  10xx xxxx
            char2 = str.charCodeAt(i++);
            char3 = str.charCodeAt(i++);
            out += String.fromCharCode(((c & 0x0F) << 12) | ((char2 & 0x3F) << 6) | ((char3 & 0x3F) << 0));
            break;
        }
    }

    var byteArray = new Uint8Array(out.length * 2);
    for (var i = 0; i < out.length; i++) {
        byteArray[i*2] = out.charCodeAt(i); // & 0xff;
        byteArray[i*2+1] = out.charCodeAt(i) >> 8; // & 0xff;
    }

    return String.fromCharCode.apply( String, byteArray );
}
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/24379446

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档