我想从PDF文件中删除元数据。我已经尝试使用"exiftool“、"pdftk”和"qpdf“来删除元数据(建议的方法- https://gist.github.com/hubgit/6078384 )。这些工具声称要删除元数据,但不幸的是保留了它们。我使用了"grep -a metadata_fieldname file.pdf“选项,我可以检索元数据值。
有没有办法完全删除PDF文件中的元数据信息(删除所有包含元数据信息的对象)。
我正在使用Ubuntu。当我使用LaTeX工具(ex- pdfTeX)或LibreOffice创建PDF文件时,该工具会自动写入生产者、创建者的信息,有时还会写入完整的横幅等信息。在PDF文件的元数据中。因此,我希望从PDF文件中删除这些信息(基本上是由PDF创建器工具存储的元数据信息)。
发布于 2020-10-03 21:06:31
要在ubuntu终端上使用pdftk删除所有pdf信息字典,可以使用以下命令:
pdftk file.pdf dump_data |sed -e 's/\(InfoValue:\)\s.*/\1\ /g' | pdftk file.pdf update_info - output file_no_meta.pdf假设file.pdf是源文件,您的pdf文件输出为file_no_meta.pdf
接下来,使用以下命令删除XMP元数据:
exiftool -all:all= -overwrite_original file_no_meta.pdf最后,在您的终端上使用以下命令再次检查文件元数据:
pdfinfo file_no_meta.pdf发布于 2021-07-18 20:07:07
您可以使用pdftk将文档的页面复制到新的PDF中,从而剥离文档中的所有Info和XMP元数据,如下所示:
pdftk A=mydoc.pdf cat A output mydoc.no_metadata.pdf发布于 2021-07-29 08:36:41
为
pdftk A=mydoc.pdf cat A output mydoc.no_metadata.pdf要工作,您需要一个旧版本的pdftk。
pdftk-java把事情搞乱了。
https://stackoverflow.com/questions/60738960
复制相似问题