首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >有损文本压缩

有损文本压缩
EN

Code Golf用户
提问于 2011-04-13 14:55:45
回答 2查看 1.6K关注 0票数 9

背景

在一个字节可以表示的256个可能字符中,只有少数字符在大多数情况下被使用。难道我们不能利用这一点,通过消除很少使用的字母的需要,使我们的文本文件更小吗?

在大多数情况下,许多字母不会增加任何价值,可以用更常见的字母来代替。例如,小写的"L“、大写"I”和数字"1“在大多数情况下看起来几乎相同,因此它们可以合并。

大写字母几乎不需要,所以可以不用大写字母。解压缩/显示程序甚至可以自动大写每个句子的第一个字母、通用名称等。

规则

参赛作品将根据:

  • 压缩比
  • 去压缩后的可读性

条目将根据本文的纯文本版本进行测试:http://en.wikipedia.org/wiki/Babbage和随机选择的英国广播公司新闻文章。

额外的分数将被授予;保留任何分数,在解压后美化(即大写句子等)。

语言

  • 任何您喜欢的,但必须很容易地编译(或解释)在一个基本的*nix框。
EN

回答 2

Code Golf用户

发布于 2011-04-13 20:10:03

Bash,5个字符

我的懒散的条目可能会赢:

代码语言:javascript
复制
bzip2

无损,所以它保持了可读性,并获得所有额外的分数!巴贝奇html的压缩比为4.79x (153804到32084字节)。

票数 2
EN

Code Golf用户

发布于 2011-04-21 01:02:04

Perl,0 chars

压缩比的无穷大,虽然不那么可读的解压缩后,所以它将失去一些标记。

票数 2
EN
页面原文内容由Code Golf提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://codegolf.stackexchange.com/questions/2039

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档