我想编写一个应用程序,可以读取和解码一个pdf文档;现在,我应该从哪里得到这种文件格式的规范?PDF格式是标准化的ISO组,但我不清楚哪里是获取这类信息的最可靠的来源。
从这个文件格式开始,什么是好的源?
发布于 2013-01-01 23:12:37
实际上,您可以同时使用您提到的两个源;这种混淆是历史性的。
Adobe发明了PDF,它发明了Acrobat产品系列,并与之一起使用。不同的PDF版本与主要的Acrobat版本一起发布(例如,PDF1.3与Acrobat 4一起发布)。
由于采用了PDF格式,而且许多ISO标准实际上依赖于专有的PDF文件格式(对于ISO标准来说不是一件容易的事情),Adobe决定将PDF格式交给ISO。
从那时起直到今天,有一个ISO委员会负责编辑PDF规范并提出新的版本。PDF的ISO标准是ISO 32000。
此外,请记住,取决于您想要在何处使用PDF,许多其他ISO标准可能非常有用或不可或缺。其中最常用的是PDF/X (用于在出版界交换PDF文件)和PDF/A (用于创建需要在长期存储中存档的PDF文件)。这些规范参考了PDF标准的特定版本,并添加了额外的要求和限制。
就规范而言,您可以直接从ISO获得所有文档。然而,对于PDF本身,您也可以从Adobe获得它,并且该文档将是相同的。请参阅Acrobat上的Acrobat站点:
http://www.adobe.com/devnet/acrobat.html
只要下载Acrobat,就可以将文档作为其中的一部分提供给您。
让我在代码中添加一个关于“针对PDF规范”的警告。我真的,真的,真的建议您更清楚地说明您对PDF (编辑、生成、质量控制(预飞))的需求,然后查找或询问满足这些需求或可以扩展以满足您的需求的现有库。
一般来说,编写支持"PDF“的东西将是一项艰巨的任务。PDF规格是大的,复杂的,充满了.好吧..。很好。有龙!
更新:
直接链接到Adobe的PDF-1.7规范文档(第一版,免费下载,在这里:
这份文件的内容后来正式成为ISO标准的一般PDF,ISO 32000-1.
但是,请注意,从ISO获得的PDF文件有一些不同:
如果您开始开发PDF软件,那么从Adobe链接上获得(免费) PDF就足够了。
更新:2021年
值得注意的是,国际标准化组织同时发布了一个新版本的PDF规范,称为ISO 32000-2。有关这方面的信息在ISO站点上。这一新版本于2017年出版,并于2020年12月收到更新。
虽然文档不会显着地改变PDF,并且大部分有关PDF的一般信息(例如免费的Adobe版本的规范)仍然是正确的,但确实有一些更改:
如果您正在编写PDF文件,特别是更简单的PDF文件,则Adobe规范仍然可以让您运行。如果您想支持PDF标准中的所有内容,您将需要支付最新的ISO版本(但无论如何,这是一个很高的要求)。
发布于 2013-01-01 16:25:01
PDF不是一种轻量级格式。它基本上是带有压缩顶部的postscript。现有的库绝对是您想要使用的,而不是自己编写的。这是一项艰巨的任务。
或者获取现有的PDF写入器应用程序,并在程序中启动它。
我没看太多,但利布努普德看上去还行。
根据维基百科的数据,PDF结合了三种技术:
https://stackoverflow.com/questions/14111831
复制相似问题