文章/答案/技术大牛

发布

社区首页 >问答首页 >Acrobat Pro DC Java脚本中基于匹配字符串的页面提取

问Acrobat Pro DC Java脚本中基于匹配字符串的页面提取
EN

Stack Overflow用户

提问于 2020-12-23 10:21:52

回答 1查看 381关注 0票数 0

我需要从具有匹配字符串的PDF文档中提取页面，例如Acrobat，在所有页面中创建一个新文件，在该文件中找到我在CSV或xlsx文件中的字符串。

这是一个示例PDF文件，我只需要有两个字符串的页面.

宏
推销员

我在搜索时发现了下面的代码，但它只搜索了一个字符串，并创建了一个匹配该字符串的新页面文件。而我需要搜索多个字符串并且只需要一个文件。任何想法请..。

// Iterates over all pages and find a given string and extracts all 
// pages on which that string is found to a new file.

var pageArray = [];

var stringToSearchFor = "Test";

for (var p = 0; p < this.numPages; p++) {
    // iterate over all words
    for (var n = 0; n < this.getPageNumWords(p); n++) {
        if (this.getPageNthWord(p, n) == stringToSearchFor) {
            pageArray.push(p);
            break;
        }
    }
}

if (pageArray.length > 0) {
    // extract all pages that contain the string into a new document
    var d = app.newDoc();    // this will add a blank page - we need to remove that once we are done
    for (var n = 0; n < pageArray.length; n++) {
        d.insertPages( {
            nPage: d.numPages-1,
            cPath: this.path,
            nStart: pageArray[n],
            nEnd: pageArray[n],
        } );
    }

    // remove the first page
    d.deletePages(0);
    
}

我假设会添加一些代码来加载CSV/XLSX文件和FOR/WHILE循环，以搜索该PDF文件中的所有字符串并存储它们的页码，然后使用所有这些页码创建一个新文件。

pdf

extract

acrobat

javascript

回答 1

Stack Overflow用户

发布于 2020-12-31 10:05:44

我找到了这里这个问题的解决方案。在这个网站上，我下载了这个Action文件做了我上面描述的事情。它做了一件额外的事情，那就是突出显示它在文件中找到的文本，它不会打扰我。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/65422656

复制

相似问题

问Acrobat Pro DC Java脚本中基于匹配字符串的页面提取
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Acrobat Pro DC Java脚本中基于匹配字符串的页面提取EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Acrobat Pro DC Java脚本中基于匹配字符串的页面提取
EN