首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >编码问题:解码怪物字符/ mojibake字符串

编码问题:解码怪物字符/ mojibake字符串
EN

Stack Overflow用户
提问于 2012-09-24 04:13:13
回答 2查看 775关注 0票数 0

我有一个“怪物人物”的句子(有人寄给我)。

��èm2,��è�:�èéè�én元,�°�,��,����,����,�,����,����,),澳大利亚人.

有什么办法把它解码回正常的角色吗?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2012-09-24 06:22:20

这个答案并不是真正的解决方案,但是在互联网上有一些软件提供了编码修复功能,可以完成这项工作。

其中一个是中文软件( http://www.cpatch.org/thread-12818-1-1.html )。我把链接放在这里,以防有人在找它。

我尝试使用PHP函数mb_detect_encodingiconv,但它们都不能成功地转换字符串。由于复制和粘贴不完整,数据可能永久丢失。

票数 0
EN

Stack Overflow用户

发布于 2014-09-17 20:20:23

从理论上讲,这是可能的。

您可以反转各种编码。例如,有一个工具可以用俄罗斯的这里来实现这一点。

当然,自动这样做要好得多;这是可以做到的,因为像Microsoft这样的程序在打开文件时也会做类似的事情。如果尝试用Word打开二进制文件,您会发现它有时会提示您选择编码,因为它找不到编码,并显示了最可能的编码列表。

我认为这样做的方式是检查有关字符事件的统计数据。例如,在英语中,"e“和"t”比"q“和"j”发生的频率要高得多。这是众所周知的;Morse代码只使用一个点和一个破折号表示"e“和"t”,而四个点和破折号表示"q“和"j”。

因此,一个这样做的假设工具可能会尝试大量的编码组合(很多!)看看哪一种最像一种真正的语言。

其他启发式方法可能是每种语言的字典,但这开始成为一个非常密集的过程。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/12558764

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档