首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >删除PDF元数据(删除完整的PDF元数据)

删除PDF元数据(删除完整的PDF元数据)
EN

Stack Overflow用户
提问于 2020-03-18 19:49:22
回答 3查看 5.9K关注 0票数 5

我想从PDF文件中删除元数据。我已经尝试使用"exiftool“、"pdftk”和"qpdf“来删除元数据(建议的方法- https://gist.github.com/hubgit/6078384 )。这些工具声称要删除元数据,但不幸的是保留了它们。我使用了"grep -a metadata_fieldname file.pdf“选项,我可以检索元数据值。

有没有办法完全删除PDF文件中的元数据信息(删除所有包含元数据信息的对象)。

我正在使用Ubuntu。当我使用LaTeX工具(ex- pdfTeX)或LibreOffice创建PDF文件时,该工具会自动写入生产者、创建者的信息,有时还会写入完整的横幅等信息。在PDF文件的元数据中。因此,我希望从PDF文件中删除这些信息(基本上是由PDF创建器工具存储的元数据信息)。

EN

回答 3

Stack Overflow用户

发布于 2020-10-03 21:06:31

要在ubuntu终端上使用pdftk删除所有pdf信息字典,可以使用以下命令:

代码语言:javascript
复制
pdftk file.pdf  dump_data |sed -e 's/\(InfoValue:\)\s.*/\1\ /g' | pdftk file.pdf update_info - output file_no_meta.pdf

假设file.pdf是源文件,您的pdf文件输出为file_no_meta.pdf

接下来,使用以下命令删除XMP元数据:

代码语言:javascript
复制
exiftool -all:all= -overwrite_original file_no_meta.pdf

最后,在您的终端上使用以下命令再次检查文件元数据:

代码语言:javascript
复制
pdfinfo file_no_meta.pdf
票数 6
EN

Stack Overflow用户

发布于 2021-07-18 20:07:07

您可以使用pdftk将文档的页面复制到新的PDF中,从而剥离文档中的所有Info和XMP元数据,如下所示:

代码语言:javascript
复制
pdftk A=mydoc.pdf cat A output mydoc.no_metadata.pdf
票数 0
EN

Stack Overflow用户

发布于 2021-07-29 08:36:41

代码语言:javascript
复制
pdftk A=mydoc.pdf cat A output mydoc.no_metadata.pdf

要工作,您需要一个旧版本的pdftk。

pdftk-java把事情搞乱了。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/60738960

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档