首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >pdftron复制错误文本

pdftron复制错误文本
EN

Stack Overflow用户
提问于 2021-02-27 09:27:11
回答 2查看 210关注 0票数 1

我想使用pdftron和一切工作完美,但当我复制文本从pdf一些字符转换为空白方块和问号,有什么想法吗?

这里是我的pdf。

如下所示:

我写了这段代码:

代码语言:javascript
复制
WebViewer({
    path: '/assets/plugins/pdftron',
    initialDoc: '/practical.pdf',
    fullAPI: true,
    disableLogs: true
}, document.getElementById('pdf')).then((instance) => {
    // PDFNet is only available with full API enabled
    const { PDFNet, docViewer } = instance;

    let Feature = instance.Feature;
    instance.disableFeatures([Feature.NotesPanel]);

    docViewer.on('documentLoaded', () => {
        // call methods relating to the loaded document
    });


    instance.textPopup.add({
        type: 'actionButton',
        img: '/language.svg',
        onClick: () => {
            const quads = docViewer.getSelectedTextQuads(docViewer.getCurrentPage());
            const text = docViewer.getSelectedText();
            $("#out-pdf").html(text);
            console.log(quads);
        },
    });
});
EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2021-03-11 23:48:54

文档似乎确实会导致不正确的提取。提取不是由PDF规范定义的,所以每个查看器处理的情况几乎没有什么不同。在您的情况下,文档中可能包含了格式错误或不完整的字体或unicode映射。我们在我们的核心组件中添加了多个修复程序,使用这些补丁,正确地进行了提取。不幸的是,目前的WebViewer版本还没有包括这些修复。我们不能给出确切的时间表,什么时候可以修复WebViewer,但至少应该是我们下一个主要版本的一部分。现在,我想看看您是否可以重新创建文档,看看这是否有帮助。我们看到和测试的大多数文档在提取方面都没有问题。

票数 2
EN

Stack Overflow用户

发布于 2021-03-03 17:07:57

您能否通过我们的支持https://www.pdftron.com/form/request/创建票证,并将这种情况发生在票证上的文档附加到票证上,这样我就可以更仔细地查看并更快地解决问题。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/66397320

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档