文章/答案/技术大牛

发布

社区首页 >问答首页 >使用Perl从PDF中提取图像/文本

问使用Perl从PDF中提取图像/文本
EN

Stack Overflow用户

提问于 2016-04-27 21:26:53

回答 2查看 845关注 0票数 2

我正在尝试使用Perl从PDF文件中提取文本/图像/表格。

我尝试使用CAM::PDF，它不是以文本形式提取的，而是以其他格式提取的。

有没有一种方法可以使用Perl模块从PDF中提取文本/图像/表格？

perl

pdf

perl-module

回答 2

Stack Overflow用户

发布于 2016-05-25 02:22:42

@priya..我尝试了这个模块，它可以很好地提取PDF文本。

use strict;
use warnings;
use PDF::OCR::Thorough;


my $filename = "pdf.pdf";

my $pdf = PDF::OCR::Thorough->new($filename);
my $text = $pdf->get_text();
print "$text";

票数 1

Stack Overflow用户

发布于 2016-04-29 22:16:35

使用CAM::PDF。它有一些方法可以帮助你提取图像或其他元素：

$doc->getProperty($pagenum, $propertyname)
Each PDF page contains a list of resources that it uses (images, fonts, etc). getPropertyNames() returns an array of the names of those resources. getProperty() returns a node representing a named property (most likely a reference node).

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/36891223

复制

相似问题

问使用Perl从PDF中提取图像/文本
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用Perl从PDF中提取图像/文本EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用Perl从PDF中提取图像/文本
EN