首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >压缩数字化文档图像

压缩数字化文档图像
EN

Stack Overflow用户
提问于 2010-06-02 23:37:38
回答 3查看 137关注 0票数 4

法律要求我们将公司的所有财务文件数字化,并每3个月提交一次评估。

由于这是敏感的数据,我们决定把事情掌握在自己的手中,建立某种数字数据存档器。该工具运行良好,但在使用7个月后,我们开始担心这些映像所使用的磁盘空间。

在这里,一些关于数字化文档数量的信息:

  • 每天扫描和归档15K文件,最终PNG大小为+- 860 of :15000*860 of= 1.53779984 of
  • 每月工作30天: 1.53779984 30 *30= 46.1339952 30
  • 一年后磁盘空间使用预期: 46.1339952千兆字节* 12 = 553.607942 12

到目前为止,我们使用的磁盘空间为424G,不包括备份。我们使用PNG作为图像格式,但我想知道是否有人对更好的图像压缩算法或压缩PNG的更多甚至更好的压缩策略有任何建议,以节省磁盘空间。

任何帮助都将不胜感激,谢谢。

EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2010-06-03 02:40:28

使用DjVu会更好,这是一种相对较新的格式,专为压缩扫描文档而设计。它可以很好地用于双角、灰度和彩色文档。它将前景/背景分离与一种复杂的小波压缩方案相结合。如果您得到了商业版本,我相信您也可以得到您的文档OCR,以便您可以搜索,但有一个完全开放源代码的版本,称为DjVuLibre

票数 3
EN

Stack Overflow用户

发布于 2010-06-03 00:03:50

据推测,这些文档不一定都是在线的。如果是这样的话,从您提供的信息来看,我看不出您需要更改工作流的任何理由。

PNG是一种广泛支持的无丢失(zlib)压缩格式,我猜您正在使用它。如果您不需要无损压缩,好的ole JPEG将给您提供更严格的压缩,而牺牲较小的质量损失,只要您适当地调整压缩比。JPEG2000可能是另一种选择,取决于您的软件栈。与PNG相比,LZW压缩TIFF除了16位/像素的支持外,没有其他任何主要优势,这一点你可能不需要。其他选项包括专有的专用编解码器(如MrSID),它们提供非常好的超大型文件压缩,并且价格低廉。

由于这些文件是扫描的,我想我会认为PDF是编码它们的“自然”格式。PDF提供了各种压缩选项,取决于文件的内容。但我不会千方百计去修理没有坏掉的东西。

如果你想一想你现在在硬盘上花了多少钱,那么每天1.5GB就没什么意义了。驾驶空间很便宜,而且越来越便宜。只需购买三个新的1 TB USB驱动器(主/备份/离地备份)每6个月,总成本240美元或任何东西。甚至磁带备份也不是不合理的。

票数 2
EN

Stack Overflow用户

发布于 2010-06-03 03:03:24

每年500 Gb并不多,而且硬盘每年都在变得越来越便宜。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/2962397

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档