首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何使用CAM::PDF提取所有页面?

如何使用CAM::PDF提取所有页面?
EN

Stack Overflow用户
提问于 2015-02-19 06:59:08
回答 1查看 1.6K关注 0票数 2
代码语言:javascript
复制
#!/perl/bin/perl -w
use CAM::PDF;
use CAM::PDF::PageText;

$filename = "test.pdf";

my $pdf = CAM::PDF->new($filename);
my $pageone_tree = $pdf->getPageContentTree(2);
$text = CAM::PDF::PageText->render($pageone_tree);
#$text =~ s/regex/modify/gi;
print $text;

使用上面的代码,我可以将pdf数据提取到一个文本文件中,但我只能得到一个页面。我想在我的pdf中得到每一页。

我知道它在包含以下内容的行中

代码语言:javascript
复制
my $pageone_tree = $pdf->getPageContentTree(2);

我不确定如何改变它。我甚至试过(1..200),它只给了我第一页。有人熟悉使用CAM::PDF吗??

EN

回答 1

Stack Overflow用户

发布于 2015-02-20 01:03:36

这就是我所需要的。

代码语言:javascript
复制
use CAM::PDF;
use CAM::PDF::PageText;
$filename = "test.pdf";

my $pdf = CAM::PDF->new($filename);
for my $page (1..$pdf->numPages) {
my $pageone_tree = $pdf->getPageContentTree($page);
$text = CAM::PDF::PageText->render($pageone_tree);
print $text;

}

numPages函数从pdf中获取页数。

票数 4
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/28595599

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档