在更大范围内,我试图从api获取大量合同,这些合同包含pdf文件,其中包含合同的详细信息。在获取这些文件之后,我使用'pdf-parse‘(https://www.npmjs.com/package/pdf-parse) node.js库来读取pdf的文本。
现在来看我的问题:如何从这些文件中读取某些值?例如,在pdf的开头,应该有对合同双方的介绍。我想得到签字方的名字和电子邮件,它的格式是这样的,几乎在pdf的开头。属性名称为偶数,信息从偶数点开始。
Name Mark Jackson
Address Winston Street 13
Email Mark@Jackson@email.com
Etc... ABCD...什么样的方法才能让我得到这些,而且只有合同的这些属性?
发布于 2020-05-14 12:53:05
所以假设字符串a
a = `Name Mark Jackson
Address Winston Street 13
Email Mark@Jackson@email.com
Etc... ABCD...
`;您可以轻松提取您的姓名和电子邮件,如下所示:
const name = a.match(/Name\s+(.*?)\n/, 'm')[1].trim();
const email = a.match(/Email\s+(.*?)\n/, 'm')[1].trim();

https://stackoverflow.com/questions/61776054
复制相似问题