首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >是否有方法检测pdf是否是?

是否有方法检测pdf是否是?
EN

Unix & Linux用户
提问于 2019-08-05 19:48:59
回答 1查看 801关注 0票数 1

我试图阻止用户上传这些类型的文件(并不是完全不同的文件类型,因为他们在技术上仍然是pdfs)。

我试过使用pdfinfo

代码语言:javascript
复制
$ pdfinfo portfolio-sample.pdf 
Title:          Sample PDF Portfolio
Subject:        Adobe Acrobat XI
Keywords:       adobe, acrobat, xi, pdf, portfolio, sample
Creator:        Adobe Acrobat Pro 10.1.3
Producer:       Adobe Acrobat Pro 10.1.3
CreationDate:   Thu Jun 21 15:03:15 2012 EDT
ModDate:        Fri Sep 28 17:49:50 2012 EDT
Tagged:         yes
UserProperties: no
Suspects:       no
Form:           none
JavaScript:     no
Pages:          1
Encrypted:      no
Page size:      504 x 360 pts
Page rot:       0
File size:      3600732 bytes
Optimized:      no
PDF version:    1.7

以及exiftool

代码语言:javascript
复制
$ exiftool -a -G1 portfolio-sample.pdf 
[ExifTool]      ExifTool Version Number         : 10.80
[System]        File Name                       : portfolio-sample.pdf
[System]        Directory                       : .
[System]        File Size                       : 3.4 MB
[System]        File Modification Date/Time     : 2019:08:05 15:23:05-04:00
[System]        File Access Date/Time           : 2019:08:05 15:25:41-04:00
[System]        File Inode Change Date/Time     : 2019:08:05 15:23:10-04:00
[System]        File Permissions                : rw-rw-r--
[File]          File Type                       : PDF
[File]          File Type Extension             : pdf
[File]          MIME Type                       : application/pdf
[PDF]           PDF Version                     : 1.7
[PDF]           Linearized                      : No
[PDF]           Create Date                     : 2012:06:21 15:03:15-04:00
[PDF]           Creator                         : Adobe Acrobat Pro 10.1.3
[PDF]           Keywords                        : adobe, acrobat, xi, pdf, portfolio, sample
[PDF]           Modify Date                     : 2012:09:28 17:49:50-04:00
[PDF]           Producer                        : Adobe Acrobat Pro 10.1.3
[PDF]           Subject                         : Adobe Acrobat XI
[PDF]           Title                           : Sample PDF Portfolio
[PDF]           Language                        : en
[PDF]           Tagged PDF                      : Yes
[PDF]           Page Count                      : 1
[XMP-x]         XMP Toolkit                     : Adobe XMP Core 5.4-c005 78.147326, 2012/08/23-13:03:03
[XMP-xmp]       Modify Date                     : 2012:09:28 17:49:50-04:00
[XMP-xmp]       Create Date                     : 2012:06:21 15:03:15-04:00
[XMP-xmp]       Metadata Date                   : 2012:09:28 17:49:50-04:00
[XMP-xmp]       Creator Tool                    : Adobe Acrobat Pro 10.1.3
[XMP-dc]        Format                          : application/pdf
[XMP-dc]        Title                           : Sample PDF Portfolio
[XMP-dc]        Creator                         : 
[XMP-dc]        Description                     : Adobe Acrobat XI
[XMP-dc]        Subject                         : adobe, acrobat, xi, pdf, portfolio, sample
[XMP-xmpMM]     Document ID                     : uuid:2d7598db-3b0a-4510-bc0a-4ac1c570a3fa
[XMP-xmpMM]     Instance ID                     : uuid:153f73de-3b2a-4d04-ab31-bb46ec3a5b79
[XMP-pdf]       Producer                        : Adobe Acrobat Pro 10.1.3
[XMP-pdf]       Keywords                        : adobe, acrobat, xi, pdf, portfolio, sample

但是输出没有显示将pdf标记为的任何标志。

EN

回答 1

Unix & Linux用户

发布于 2021-07-13 14:09:32

您可以使用python模块python-poppler

代码语言:javascript
复制
from poppler import load_from_file

pdf_document = load_from_file("portfolio-sample.pdf")

if pdf_document.has_embedded_files():
    print("PDF contains Adobe Portfolio attachments")
票数 0
EN
页面原文内容由Unix & Linux提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://unix.stackexchange.com/questions/534027

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档