首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Ghostscript -字符编码的问题

Ghostscript -字符编码的问题
EN

Stack Overflow用户
提问于 2018-10-30 14:03:41
回答 1查看 2.6K关注 0票数 0

我有一个PDF/A文档已经在我的扫描仪OCRed。文件有点倾斜,所以我用幽灵脚本将它旋转1度,如下所示:

代码语言:javascript
复制
gs -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -dSAFER \
   -dPDFSETTINGS="/screen" \
   -dSubsetFonts=true -dEmbedAllFonts=true \
   -sPAPERSIZE=a4 -sOutputFile="out.pdf" \
   -c "<</BeginPage{1 rotate}>> setpagedevice" \
   -f in.pdf

(这是一个改编自另一个线程的片段)

它做得很好,但是有文本编码的东西是不对的--当我从原始文档复制和粘贴带有波兰字母的单词(ąśćęłńźż)时,一切正常,但是当我从上面的命令复制和粘贴相同的单词时,这个波兰字母被转换为'~‘("opłata“-> "op~ata","wpłynęło”->“wp~yn~o”))。我怎样才能保存这些文字?我真的需要它不变。

编辑:上述命令的输出:

代码语言:javascript
复制
GPL Ghostscript 9.25 (2018-09-13)
Copyright (C) 2018 Artifex Software, Inc.  All rights reserved.
This software comes with NO WARRANTY: see the file PUBLIC for details.
Processing pages 1 through 3.
Page 1
Loading NimbusSans-Regular font from /usr/local/Cellar/ghostscript/9.25/share/ghostscript/9.25/Resource/Font/NimbusSans-Regular... 5076560 3564226 2614872 1261064 3 done.
Loading NimbusSans-Bold font from /usr/local/Cellar/ghostscript/9.25/share/ghostscript/9.25/Resource/Font/NimbusSans-Bold... 5142672 3737333 2635072 1280462 3 done.
Loading NimbusSans-Italic font from /usr/local/Cellar/ghostscript/9.25/share/ghostscript/9.25/Resource/Font/NimbusSans-Italic... 5310168 3943119 2816872 1460233 3 done.
Loading NimbusSans-BoldItalic font from /usr/local/Cellar/ghostscript/9.25/share/ghostscript/9.25/Resource/Font/NimbusSans-BoldItalic... 5497480 4140597 3059272 1695969 3 done.
Page 2
Page 3
EN

回答 1

Stack Overflow用户

发布于 2018-10-30 14:15:29

首先要尝试的是而不是来设置SubsetFonts=true。

如果您的原始PDF文件没有ToUnicode CMap,那么您可以选择“启发式”(也称为猜测)来从给定的字符编码中确定Unicode点。

如果原始文档工作正常,那么字符编码很可能与ASCII或类似的字符编码相匹配。但是,当您对字体进行子集时,编码会被更改。基本上,遇到的第一个字符变成编码位置1,第二个字符变成2,等等。

当然,当你试图剪切和粘贴时,这会引起问题。

但是,考虑到您使用的字符超出了正常的ASCII范围,这不太可能是问题所在。

您可能使用的是旧版本的Ghostscript+pdfwrite (您实际上没有说明所使用的版本,也没有提供后面的通道输出,也就是说)及其已修复的错误。

但是坦率地说,没有看到输入的PDF文件,任何人几乎不可能弄清楚为什么新的PDF文件是不同的,因此不可能为您提供任何有用的建议,除了猜测。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/53066086

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档