法律要求我们将公司的所有财务文件数字化,并每3个月提交一次评估。
由于这是敏感的数据,我们决定把事情掌握在自己的手中,建立某种数字数据存档器。该工具运行良好,但在使用7个月后,我们开始担心这些映像所使用的磁盘空间。
在这里,一些关于数字化文档数量的信息:
到目前为止,我们使用的磁盘空间为424G,不包括备份。我们使用PNG作为图像格式,但我想知道是否有人对更好的图像压缩算法或压缩PNG的更多甚至更好的压缩策略有任何建议,以节省磁盘空间。
任何帮助都将不胜感激,谢谢。
发布于 2010-06-03 02:40:28
使用DjVu会更好,这是一种相对较新的格式,专为压缩扫描文档而设计。它可以很好地用于双角、灰度和彩色文档。它将前景/背景分离与一种复杂的小波压缩方案相结合。如果您得到了商业版本,我相信您也可以得到您的文档OCR,以便您可以搜索,但有一个完全开放源代码的版本,称为DjVuLibre。
发布于 2010-06-03 00:03:50
据推测,这些文档不一定都是在线的。如果是这样的话,从您提供的信息来看,我看不出您需要更改工作流的任何理由。
PNG是一种广泛支持的无丢失(zlib)压缩格式,我猜您正在使用它。如果您不需要无损压缩,好的ole JPEG将给您提供更严格的压缩,而牺牲较小的质量损失,只要您适当地调整压缩比。JPEG2000可能是另一种选择,取决于您的软件栈。与PNG相比,LZW压缩TIFF除了16位/像素的支持外,没有其他任何主要优势,这一点你可能不需要。其他选项包括专有的专用编解码器(如MrSID),它们提供非常好的超大型文件压缩,并且价格低廉。
由于这些文件是扫描的,我想我会认为PDF是编码它们的“自然”格式。PDF提供了各种压缩选项,取决于文件的内容。但我不会千方百计去修理没有坏掉的东西。
如果你想一想你现在在硬盘上花了多少钱,那么每天1.5GB就没什么意义了。驾驶空间很便宜,而且越来越便宜。只需购买三个新的1 TB USB驱动器(主/备份/离地备份)每6个月,总成本240美元或任何东西。甚至磁带备份也不是不合理的。
发布于 2010-06-03 03:03:24
每年500 Gb并不多,而且硬盘每年都在变得越来越便宜。
https://stackoverflow.com/questions/2962397
复制相似问题