在一个字节可以表示的256个可能字符中,只有少数字符在大多数情况下被使用。难道我们不能利用这一点,通过消除很少使用的字母的需要,使我们的文本文件更小吗?
在大多数情况下,许多字母不会增加任何价值,可以用更常见的字母来代替。例如,小写的"L“、大写"I”和数字"1“在大多数情况下看起来几乎相同,因此它们可以合并。
大写字母几乎不需要,所以可以不用大写字母。解压缩/显示程序甚至可以自动大写每个句子的第一个字母、通用名称等。
参赛作品将根据:
条目将根据本文的纯文本版本进行测试:http://en.wikipedia.org/wiki/Babbage和随机选择的英国广播公司新闻文章。
额外的分数将被授予;保留任何分数,在解压后美化(即大写句子等)。
发布于 2011-04-13 20:10:03
我的懒散的条目可能会赢:
bzip2无损,所以它保持了可读性,并获得所有额外的分数!巴贝奇html的压缩比为4.79x (153804到32084字节)。
发布于 2011-04-21 01:02:04
压缩比的无穷大,虽然不那么可读的解压缩后,所以它将失去一些标记。
https://codegolf.stackexchange.com/questions/2039
复制相似问题