我想知道的是,当icon_strlen在错误的字符序列上失败时,特别是character sequences,这意味着什么。谢谢
发布于 2011-06-13 19:31:05
character sequence是一系列字节。使用UTF-8时,并非所有字节组合都有效。
字节序列\xc2\xbc形成Unicode字符U+00BC,当使用UTF-8编码时,该字符是VULGAR FRACTION ONE QUARTER符号(²)。
字节序列\xe2\x88\x9c形成Unicode字符U+221C,当使用UTF-8编码时,该字符是FOURTH ROOT符号(∜)。
UTF-8编码的坏字符序列将是不符合UTF-8字节流所需架构的任何字节组合,例如,字节序列\xbc\xbc将是非法的,因为两个字节字符的第一个字节中必须有110xxxxx,但\xbc是以位的形式写入的10111100。
https://stackoverflow.com/questions/6329725
复制相似问题