Brotli是当今应用最广泛却鲜为人知的压缩格式之一,已被各大浏览器和内容分发网络广泛采用。然而在PDF文档领域,自1996年版本1.2以来,PDF一直采用FlateDecode过滤器进行压缩,该过滤器也被用于.zip和.png文件的压缩。
这一现状即将改变。PDF协会正推进在今年夏季发布规范说明书,供开发者在PDF处理器中添加Brotli支持。业界期待Brotli能够快速纳入由国际标准化组织维护的官方PDF 2.0标准ISO 32000-2。
随着PDF文件大小不断增加,企业数据湖中存储的文件数量每年激增数十亿,对更高效压缩方法的需求前所未有。
使用Brotli压缩的优势在于能显著减小PDF文件体积。根据PDF协会成员Artifex Software在2025年的测试,平均可减少10%至25%的文件大小,具体取决于所编码内容的类型。
然而对企业而言,这只是工作的开始。当采用Brotli压缩的PDF开始流通时,未更新应用程序和库依赖项的用户将无法解压和打开新格式文件。这对PDF来说是首次出现这样的情况——尽管自2008年成为ISO标准以来,PDF已添加众多新功能,但从未阻止用户打开PDF文件。
最主要需要升级以支持Brotli的软件包括专有PDF创建和阅读工具,如Adobe Acrobat、Foxit PDF编辑器和Nitro PDF。浏览器集成的PDF阅读器也属此列。
除此之外,还有大量不太显眼的开源工具、库和SDK生态系统,它们在企业PDF工作流和自动化批处理中被广泛使用。查找并更新这些组件,特别是那些隐藏在第三方库深处的组件,将耗时颇多。
如果企业延迟更新,则有可能遇到采用支持Brotli的新软件创建的PDF文件,这些文件将无法在其旧版、未更新的程序上打开。当用户联系IT团队报告无法打开文件时,IT人员将直面这一问题。
为了推动Brotli的采用,文档处理开发商Apryse的软件工程师Guust Ysebie指出,开发者需要鼓励和支持。他表示:"必须有人第一个跳出来并制造声势,这样其他产品才会跟进。"
这是一个挑战,因为如Ysebie在PDF协会网站的文章中所解释的,Brotli的采用速度缓慢,原因在于PDF规范需要数百个利益相关者达成共识。
他建议通过三种方式缓解这一过渡过程。最简单的方法是通过多种信息渠道宣传升级必要性,作为意识提升活动的一部分。
一个更激进的建议是,启用Brotli的PDF可以设置为使旧版阅读器不再崩溃,而是显示"不支持"错误信息,鼓励客户升级,作为压缩内容的占位符。
最后一种策略是,志同道合的开发者主动升级开源库。Ysebie表示他已为多个库添加了Brotli支持,包括Apryse的iText SDK。
他指出,这就是现实中采用的方式:先非官方地创建功能,然后早期采用者实现它,这促使更大的产品也采用它。采用Brotli软件的关键时刻将是其在Adobe Reader中的出现。这将在某个时刻发生,但具体时间仍不清楚。
好消息是,由于只有有限数量的软件库需要升级,为这些软件添加支持应该很直接。然而,企业仍需将这些更新的镜像应用到当前应用中。
关于何时将Brotli添加到ISO PDF 2.0规范(自2015年以来在进行中)中,Ysebie同意这还有很长的路要走。但业界必须在某个时刻从旧技术转向新技术。他表示,"我们需要推动生态系统向前发展。开始会有些混乱,但未来潜力巨大。"
Q&A
Q1:Brotli压缩格式相比传统FlateDecode有什么优势?
A:Brotli可以将PDF文件大小平均减少10%至25%,具体取决于内容类型。它已在浏览器和CDN中广泛应用,具有高度的可靠性和效率。
Q2:企业升级支持Brotli会面临什么挑战?
A:企业需要更新各种应用程序、库和SDK,包括Adobe Acrobat、Foxit等专有软件和众多隐藏在第三方库中的开源组件。未更新的系统将无法打开采用Brotli压缩的PDF文件。
Q3:Brotli的采用推广有什么障碍?
A:PDF规范需要数百个利益相关者达成共识,这导致采用速度缓慢。业界可通过提升意识、优化错误提示、开发者主动升级开源库等方式推动采用。Adobe Reader的支持将是关键转折点。