我正在尝试读取pdf文件的内容。下面是代码
4 use warnings;
5 use strict;
6
7 use PDF;
8
9 print "*" x 30, "\n";
10 my $filename = shift;
11 print "Filename: $filename\n";
12
13 my $pdf = PDF->new($filename);这是输出:
******************************
Filename: Calabasas, LA County June 2012 monthly-new-projects-report.pdf
Can't read cross-reference section, according to trailer当我在google上冲浪时,我发现这与文件损坏有某种关系。但我仍然可以用pdf阅读器打开它。
我应该尝试不同的Perl模块,还是我的代码坏了?
发布于 2012-08-16 22:05:48
不知道这是你要找的(一个纯perl解决方案还是一个windows解决方案),但在Unix中,我调用"pdftotext“来为我做转换,然后我读取文件:
open IN, '-|', '/usr/bin/pdftotext', $file, '-'
or die "couldn't open $file $!\n";希望它能帮上忙!
https://stackoverflow.com/questions/11651502
复制相似问题