我使用可用的命令行将PDF拆分为多个页面:
for G in $(seq 1 $(pdfinfo 47.pdf | sed -n 's/Pages:[^0-9]*\([0-9]*\).*/\1/p')) ; do
gs \
-dSAFER \
-sDEVICE=pdfwrite \
-dBATCH \
-dNOPAUSE \
-dFirstPage=$G \
-dLastPage=$G \
-o $G.pdf \
47.pdf ;
done但某些页面显示时没有文本(图形仍然存在)
因此,我尝试从PDF中提取嵌入字体:
gs -q -dNODISPLAY extractFonts.ps -c "(47.pdf) extractFonts quit"这些字体我已经安装在系统字体文件夹中了。
在那之后,我进行了重复拆分,并且没有发生任何更改。
如何-确保页面将被正确提取,我现在不知道。
发布于 2012-06-25 17:44:02
Ghostscript和pdfwrite实际上并不是用来拆分PDF文件的,还有其他工具可能会工作得更好,为什么不试试pdftk呢?
如果你真的想使用Ghostscript,那么我建议你从Git存储库获取最新的尖端代码,在这些代码中,pdfwrite设备将接受包含'%d‘的输出文件名,并将每页写入一个文件。
除此之外,在我看来,最有可能的情况是你只是遇到了一个bug,而不是“丢失字体”,如果字体丢失,文本将仍然存在,但使用的字体不同。您使用的是哪个版本的GS?
https://stackoverflow.com/questions/11186504
复制相似问题