首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >从PDF中提取页面时Ghostscript丢失字体

从PDF中提取页面时Ghostscript丢失字体
EN

Stack Overflow用户
提问于 2012-06-25 17:19:18
回答 1查看 599关注 0票数 0

我使用可用的命令行将PDF拆分为多个页面:

代码语言:javascript
复制
for G in $(seq 1 $(pdfinfo 47.pdf | sed -n 's/Pages:[^0-9]*\([0-9]*\).*/\1/p')) ; do 
   gs \
    -dSAFER \
    -sDEVICE=pdfwrite \
    -dBATCH \
    -dNOPAUSE \
    -dFirstPage=$G \
    -dLastPage=$G \
    -o $G.pdf \
     47.pdf ;
done

但某些页面显示时没有文本(图形仍然存在)

因此,我尝试从PDF中提取嵌入字体:

代码语言:javascript
复制
gs -q -dNODISPLAY extractFonts.ps -c "(47.pdf) extractFonts quit"

这些字体我已经安装在系统字体文件夹中了。

在那之后,我进行了重复拆分,并且没有发生任何更改。

如何-确保页面将被正确提取,我现在不知道。

EN

回答 1

Stack Overflow用户

发布于 2012-06-25 17:44:02

Ghostscript和pdfwrite实际上并不是用来拆分PDF文件的,还有其他工具可能会工作得更好,为什么不试试pdftk呢?

如果你真的想使用Ghostscript,那么我建议你从Git存储库获取最新的尖端代码,在这些代码中,pdfwrite设备将接受包含'%d‘的输出文件名,并将每页写入一个文件。

除此之外,在我看来,最有可能的情况是你只是遇到了一个bug,而不是“丢失字体”,如果字体丢失,文本将仍然存在,但使用的字体不同。您使用的是哪个版本的GS?

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/11186504

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档