有谁知道一个简单的(可能是免费的) Windows PDF提取器吗?
我想从PDF中提取原始图像,因为它们是嵌入的(保存图像元信息),所以我可以做一些取证来分析这些提取的图像。
当我谷歌的时候,我发现很多欺骗性的网站说它是免费的,但是有10个广告看起来像下载按钮和病毒在里面。
有人能推荐好的软件吗?
发布于 2015-12-15 07:07:14
如果您在工具栏面板的左侧勾选“提取图像”选项,FlexPaper元素可以从您的PDF中提取图像。你可以在这里下载并试用。
http://flexpaper.devaldi.com/download/
注意:这个答案可能是由开发人员提供的。
发布于 2016-03-29 17:53:32
这已经有一段时间了,但在XP下,我使用了一个叫做pdf2jpg的工具。它有一个错误,您只能从一个PDF中提取文件(尽管您选择了更多);然后您必须关闭/重新启动程序。但是,它做了我所需要的;-)
如今,也有一些在线服务可以让你提取图像。举几个例子:
发布于 2016-11-11 21:14:02
如果您想开发这样的应用程序,我建议您检查一下LEADTOOLS文档成像SDK。LEADTOOLS提供了用于处理此问题的.NET库,在这里的支持论坛上发布了一个示例项目:https://www.leadtools.com/support/forum/posts/m41715-Extracting-embedded-images-from-a-PDF-file#post41715
相关的示例代码如下:
// Open PDF file
using (PDFDocument pdfDoc = new PDFDocument(filename, password))
{
// Set load resolution for the embeded images
pdfDoc.Resolution = 150;
// Parse the pages
pdfDoc.ParsePages(PDFParsePagesOptions.Objects, 1, -1);
using (RasterCodecs codecs = new RasterCodecs())
foreach (PDFDocumentPage page in pdfDoc.Pages)
if (page.Objects != null && page.Objects.Count > 0)
foreach (PDFObject obj in page.Objects)
if (obj.ObjectType == PDFObjectType.Image)
using (RasterImage image = pdfDoc.DecodeImage(obj.ImageObjectNumber))
codecs.Save(image, targetDir + obj.ImageObjectNumber + "." + saveFormat.Extension, saveFormat.Format, 0, 1, 1, -1, CodecsSavePageMode.Overwrite);
}免责声明:我是写这个图书馆的公司的员工。
https://softwarerecs.stackexchange.com/questions/26834
复制相似问题