有人可以帮助从pdf页面中提取文本吗?
<?php
$pdf = Zend_Pdf::load('example.pdf');
$page = $pdf->page[0];我假设存在一个页面方法,但是我找不到任何东西可以让我提取内容。
示例:$page->getContents();$page->toString();$page->extractText();
...Help!这快把我逼疯了!
发布于 2010-03-23 05:02:48
我同意Andy的观点,这似乎不被支持。作为另一种选择,可以看看Shaun Farrell's solution to extracting text from a PDF for use with Zend_Search_Lucene。他使用XPDF,这也可能满足您的需求。
发布于 2010-03-23 00:03:39
从the manual来看,似乎不支持此功能。此外,新文本是使用drawText() function编写的,它似乎是在编写图像,而不是普通的“可解码”文本。
https://stackoverflow.com/questions/2493585
复制相似问题