我想使用pdftron和一切工作完美,但当我复制文本从pdf一些字符转换为空白方块和问号,有什么想法吗?
这里是我的pdf。
如下所示:

我写了这段代码:
WebViewer({
path: '/assets/plugins/pdftron',
initialDoc: '/practical.pdf',
fullAPI: true,
disableLogs: true
}, document.getElementById('pdf')).then((instance) => {
// PDFNet is only available with full API enabled
const { PDFNet, docViewer } = instance;
let Feature = instance.Feature;
instance.disableFeatures([Feature.NotesPanel]);
docViewer.on('documentLoaded', () => {
// call methods relating to the loaded document
});
instance.textPopup.add({
type: 'actionButton',
img: '/language.svg',
onClick: () => {
const quads = docViewer.getSelectedTextQuads(docViewer.getCurrentPage());
const text = docViewer.getSelectedText();
$("#out-pdf").html(text);
console.log(quads);
},
});
});发布于 2021-03-11 23:48:54
文档似乎确实会导致不正确的提取。提取不是由PDF规范定义的,所以每个查看器处理的情况几乎没有什么不同。在您的情况下,文档中可能包含了格式错误或不完整的字体或unicode映射。我们在我们的核心组件中添加了多个修复程序,使用这些补丁,正确地进行了提取。不幸的是,目前的WebViewer版本还没有包括这些修复。我们不能给出确切的时间表,什么时候可以修复WebViewer,但至少应该是我们下一个主要版本的一部分。现在,我想看看您是否可以重新创建文档,看看这是否有帮助。我们看到和测试的大多数文档在提取方面都没有问题。
发布于 2021-03-03 17:07:57
您能否通过我们的支持https://www.pdftron.com/form/request/创建票证,并将这种情况发生在票证上的文档附加到票证上,这样我就可以更仔细地查看并更快地解决问题。
https://stackoverflow.com/questions/66397320
复制相似问题