在浏览我的pdf中的正则表达式时,在许多地方,我看到一些字符被方框替换,方框是一些ASCII代码
我有什么办法可以解决这个问题吗?
我已经检查过这个链接
http://www.tableausoftware.com/support/knowledge-base/square-boxes
http://acrobatusers.com/tutorials/text-matching-regular-expressions和其他人,但没有找到任何解决方案。方形盒子看起来是什么样子的。

发布于 2011-09-22 02:54:09
正如stema所说,这与正则表达式无关。
它也不是关于一些"pdf转义序列“,因为PDF使用二进制安全文本编码。
这些方形块通常显示在一些没有所选字体表示的字符的位置。通常,排版软件会用“更好”的Unicode替换掉一些引号或其他字符;但字体中没有这些字符。
您可以尝试将文本从PDF复制/粘贴到其他文档中并替换字体,甚至可以使用一些PDF编辑工具(enfocus PitStop是最流行的编辑工具之一;它很便宜,但不是免费的)来用另一种更完整的字体替换字体。
发布于 2011-09-22 02:33:41
首先,这与regex无关,除了您正在编写的文档是关于正则表达式的。
我假设,被正方形替换的序列是\s,不是吗?
我认为这里的问题是一些正则表达式快捷键在pdf创建过程中被解释为转义序列,因此没有按字面打印出来。
您不需要编写如何创建pdf,但我假设当您转义反斜杠时,当您想要逐字打印它们时,这是可以的。
因此,当您想在pdf中看到\s时,可以在源格式中输入\\s。(如果您有想要打印的转义反斜杠,如\\,则编写\\\\)。
发布于 2011-12-06 03:53:57
Javier的答案几乎是完整的。但让我补充一下:
您将有很小的机会让Acrobat Reader通过切换其应用程序首选项中的特定设置,使用“替换”字体显示方框。
IIRC中,该设置被称为“使用本地字体”。你通常可以在preferences设置的页面显示部分找到它,但在不同的版本中,Adobe不断添加、删除或重新定位不同的设置……
背景信息:如果您没有启用使用本地字体,那么您要求阅读器仅使用嵌入的字体来显示所有文本。如果字体是嵌入的,但遗漏了一些所需的字形,启用上述设置可能会在您的系统上找到所需的字体来呈现文本,或者阅读器可能会使用其内置的多个Master字体,这些字体或多或少会试图伪造原始字形的外观。
https://stackoverflow.com/questions/7502612
复制相似问题