文章/答案/技术大牛

发布

社区首页 >问答首页 >删除PDF元数据(删除完整的PDF元数据)

问删除PDF元数据(删除完整的PDF元数据)
EN

Stack Overflow用户

提问于 2020-03-18 19:49:22

回答 3查看 5.9K关注 0票数 5

我想从PDF文件中删除元数据。我已经尝试使用"exiftool“、"pdftk”和"qpdf“来删除元数据(建议的方法- https://gist.github.com/hubgit/6078384 )。这些工具声称要删除元数据，但不幸的是保留了它们。我使用了"grep -a metadata_fieldname file.pdf“选项，我可以检索元数据值。

有没有办法完全删除PDF文件中的元数据信息(删除所有包含元数据信息的对象)。

我正在使用Ubuntu。当我使用LaTeX工具(ex- pdfTeX)或LibreOffice创建PDF文件时，该工具会自动写入生产者、创建者的信息，有时还会写入完整的横幅等信息。在PDF文件的元数据中。因此，我希望从PDF文件中删除这些信息(基本上是由PDF创建器工具存储的元数据信息)。

pdf

metadata

回答 3

Stack Overflow用户

发布于 2020-10-03 21:06:31

要在ubuntu终端上使用pdftk删除所有pdf信息字典，可以使用以下命令：

pdftk file.pdf  dump_data |sed -e 's/\(InfoValue:\)\s.*/\1\ /g' | pdftk file.pdf update_info - output file_no_meta.pdf

假设file.pdf是源文件，您的pdf文件输出为file_no_meta.pdf

接下来，使用以下命令删除XMP元数据：

exiftool -all:all= -overwrite_original file_no_meta.pdf

最后，在您的终端上使用以下命令再次检查文件元数据：

pdfinfo file_no_meta.pdf

票数 6

Stack Overflow用户

发布于 2021-07-18 20:07:07

您可以使用pdftk将文档的页面复制到新的PDF中，从而剥离文档中的所有Info和XMP元数据，如下所示：

pdftk A=mydoc.pdf cat A output mydoc.no_metadata.pdf

票数 0

Stack Overflow用户

发布于 2021-07-29 08:36:41

为

pdftk A=mydoc.pdf cat A output mydoc.no_metadata.pdf

要工作，您需要一个旧版本的pdftk。

pdftk-java把事情搞乱了。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/60738960

复制

相似问题

问删除PDF元数据(删除完整的PDF元数据)
EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问删除PDF元数据(删除完整的PDF元数据)EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问删除PDF元数据(删除完整的PDF元数据)
EN