首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Acrobat Pro DC Java脚本中基于匹配字符串的页面提取

Acrobat Pro DC Java脚本中基于匹配字符串的页面提取
EN

Stack Overflow用户
提问于 2020-12-23 10:21:52
回答 1查看 381关注 0票数 0

我需要从具有匹配字符串的PDF文档中提取页面,例如Acrobat,在所有页面中创建一个新文件,在该文件中找到我在CSV或xlsx文件中的字符串。

这是一个示例PDF文件,我只需要有两个字符串的页面.

  1. 推销员

我在搜索时发现了下面的代码,但它只搜索了一个字符串,并创建了一个匹配该字符串的新页面文件。而我需要搜索多个字符串并且只需要一个文件。任何想法请..。

代码语言:javascript
复制
// Iterates over all pages and find a given string and extracts all 
// pages on which that string is found to a new file.

var pageArray = [];

var stringToSearchFor = "Test";

for (var p = 0; p < this.numPages; p++) {
    // iterate over all words
    for (var n = 0; n < this.getPageNumWords(p); n++) {
        if (this.getPageNthWord(p, n) == stringToSearchFor) {
            pageArray.push(p);
            break;
        }
    }
}

if (pageArray.length > 0) {
    // extract all pages that contain the string into a new document
    var d = app.newDoc();    // this will add a blank page - we need to remove that once we are done
    for (var n = 0; n < pageArray.length; n++) {
        d.insertPages( {
            nPage: d.numPages-1,
            cPath: this.path,
            nStart: pageArray[n],
            nEnd: pageArray[n],
        } );
    }

    // remove the first page
    d.deletePages(0);
    
}

我假设会添加一些代码来加载CSV/XLSX文件和FOR/WHILE循环,以搜索该PDF文件中的所有字符串并存储它们的页码,然后使用所有这些页码创建一个新文件。

EN

回答 1

Stack Overflow用户

发布于 2020-12-31 10:05:44

我找到了这里这个问题的解决方案。在这个网站上,我下载了这个Action文件做了我上面描述的事情。它做了一件额外的事情,那就是突出显示它在文件中找到的文本,它不会打扰我。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/65422656

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档