首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何使用xpdf从xpdf中提取文本?

如何使用xpdf从xpdf中提取文本?
EN

Stack Overflow用户
提问于 2012-02-14 23:58:08
回答 3查看 9K关注 0票数 1

我在一个文件夹里有很多PDF。我想使用xpdf从这些xpdf中提取文本。例如:

从example1.txt

  • example2.pdf提取到example2.txt

  • etc..

  • example1.pdf

这是我的代码:

代码语言:javascript
复制
<?php

$path = 'C:/AppServ/www/pdfs/';
$dir = opendir($path);
$f = readdir($dir);

while ($f = readdir($dir)) {
    if (eregi("\.pdf",$f)){
        $content = shell_exec('C:/AppServ/www/pdfs/pdftotext '.$f.' ');
        $read = strtok ($f,".");
        $testfile = "$read.txt";
        $file = fopen($testfile,"r");
        if (filesize($testfile)==0){} 
        else{
           $text = fread($file,filesize($testfile));
        fclose($file);
        echo "</br>"; echo "</br>";
        }
    }
}

我得到了空白的结果。我的密码怎么了?

EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2012-08-08 07:25:47

试着使用以下方法:

代码语言:javascript
复制
$dir      = opendir($path);
$filename = array();

while ($filename = readdir($dir)) {
if (eregi("\.pdf",$filename)){
    $content  = shell_exec('C:/AppServ/www/pdfs/pdftotext '.$filename.' ');
    $read     = strtok ($filename,".");
    $testfile = "$read.txt";
    $file     = fopen($testfile,"r");
    if (filesize($testfile)==0){} 
    else{
        $text = fread($file,filesize($testfile));
        fclose($file);
        echo "</br>"; echo "</br>";
    }
}
票数 2
EN

Stack Overflow用户

发布于 2012-02-15 01:27:47

您不必创建临时txt文件。

代码语言:javascript
复制
$command = '/AppServ/www/pdfs/pdftotext ' . $filename . ' -';
$a = exec($command, $text, $retval);
echo $text;

如果不工作,请检查服务器的错误日志。

票数 0
EN

Stack Overflow用户

发布于 2012-12-13 12:43:54

线

代码语言:javascript
复制
echo "</br>";
echo "</br>";

应该是

代码语言:javascript
复制
echo "</br>";
echo $text."</br>";

希望这能有所帮助

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/9286036

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档