我有一个“怪物人物”的句子(有人寄给我)。
��èm2,��è�:�èéè�én元,�°�,��,����,����,�,����,����,),澳大利亚人.
有什么办法把它解码回正常的角色吗?
发布于 2012-09-24 06:22:20
这个答案并不是真正的解决方案,但是在互联网上有一些软件提供了编码修复功能,可以完成这项工作。
其中一个是中文软件( http://www.cpatch.org/thread-12818-1-1.html )。我把链接放在这里,以防有人在找它。
我尝试使用PHP函数mb_detect_encoding和iconv,但它们都不能成功地转换字符串。由于复制和粘贴不完整,数据可能永久丢失。
发布于 2014-09-17 20:20:23
从理论上讲,这是可能的。
您可以反转各种编码。例如,有一个工具可以用俄罗斯的这里来实现这一点。
当然,自动这样做要好得多;这是可以做到的,因为像Microsoft这样的程序在打开文件时也会做类似的事情。如果尝试用Word打开二进制文件,您会发现它有时会提示您选择编码,因为它找不到编码,并显示了最可能的编码列表。
我认为这样做的方式是检查有关字符事件的统计数据。例如,在英语中,"e“和"t”比"q“和"j”发生的频率要高得多。这是众所周知的;Morse代码只使用一个点和一个破折号表示"e“和"t”,而四个点和破折号表示"q“和"j”。
因此,一个这样做的假设工具可能会尝试大量的编码组合(很多!)看看哪一种最像一种真正的语言。
其他启发式方法可能是每种语言的字典,但这开始成为一个非常密集的过程。
https://stackoverflow.com/questions/12558764
复制相似问题