我需要从具有匹配字符串的PDF文档中提取页面,例如Acrobat,在所有页面中创建一个新文件,在该文件中找到我在CSV或xlsx文件中的字符串。
这是一个示例PDF文件,我只需要有两个字符串的页面.
我在搜索时发现了下面的代码,但它只搜索了一个字符串,并创建了一个匹配该字符串的新页面文件。而我需要搜索多个字符串并且只需要一个文件。任何想法请..。
// Iterates over all pages and find a given string and extracts all
// pages on which that string is found to a new file.
var pageArray = [];
var stringToSearchFor = "Test";
for (var p = 0; p < this.numPages; p++) {
// iterate over all words
for (var n = 0; n < this.getPageNumWords(p); n++) {
if (this.getPageNthWord(p, n) == stringToSearchFor) {
pageArray.push(p);
break;
}
}
}
if (pageArray.length > 0) {
// extract all pages that contain the string into a new document
var d = app.newDoc(); // this will add a blank page - we need to remove that once we are done
for (var n = 0; n < pageArray.length; n++) {
d.insertPages( {
nPage: d.numPages-1,
cPath: this.path,
nStart: pageArray[n],
nEnd: pageArray[n],
} );
}
// remove the first page
d.deletePages(0);
}
我假设会添加一些代码来加载CSV/XLSX文件和FOR/WHILE循环,以搜索该PDF文件中的所有字符串并存储它们的页码,然后使用所有这些页码创建一个新文件。
发布于 2020-12-31 10:05:44
我找到了这里这个问题的解决方案。在这个网站上,我下载了这个Action文件做了我上面描述的事情。它做了一件额外的事情,那就是突出显示它在文件中找到的文本,它不会打扰我。
https://stackoverflow.com/questions/65422656
复制相似问题