首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何使用Zend_Pdf从pdf页面提取文本

如何使用Zend_Pdf从pdf页面提取文本
EN

Stack Overflow用户
提问于 2010-03-22 23:41:22
回答 2查看 4.1K关注 0票数 2

有人可以帮助从pdf页面中提取文本吗?

代码语言:javascript
复制
<?php
$pdf = Zend_Pdf::load('example.pdf');
$page = $pdf->page[0];

我假设存在一个页面方法,但是我找不到任何东西可以让我提取内容。

示例:$page->getContents();$page->toString();$page->extractText();

...Help!这快把我逼疯了!

EN

回答 2

Stack Overflow用户

发布于 2010-03-23 05:02:48

我同意Andy的观点,这似乎不被支持。作为另一种选择,可以看看Shaun Farrell's solution to extracting text from a PDF for use with Zend_Search_Lucene。他使用XPDF,这也可能满足您的需求。

票数 2
EN

Stack Overflow用户

发布于 2010-03-23 00:03:39

the manual来看,似乎不支持此功能。此外,新文本是使用drawText() function编写的,它似乎是在编写图像,而不是普通的“可解码”文本。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/2493585

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档