首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用node.js获取pdf格式的特定信息

使用node.js获取pdf格式的特定信息
EN

Stack Overflow用户
提问于 2020-05-13 21:33:53
回答 1查看 103关注 0票数 0

在更大范围内,我试图从api获取大量合同,这些合同包含pdf文件,其中包含合同的详细信息。在获取这些文件之后,我使用'pdf-parse‘(https://www.npmjs.com/package/pdf-parse) node.js库来读取pdf的文本。

现在来看我的问题:如何从这些文件中读取某些值?例如,在pdf的开头,应该有对合同双方的介绍。我想得到签字方的名字和电子邮件,它的格式是这样的,几乎在pdf的开头。属性名称为偶数,信息从偶数点开始。

代码语言:javascript
复制
Name          Mark Jackson 
Address       Winston Street 13 
Email         Mark@Jackson@email.com 
Etc...        ABCD...

什么样的方法才能让我得到这些,而且只有合同的这些属性?

EN

回答 1

Stack Overflow用户

发布于 2020-05-14 12:53:05

所以假设字符串a

代码语言:javascript
复制
a = `Name          Mark Jackson 
Address       Winston Street 13 
Email         Mark@Jackson@email.com 
Etc...        ABCD...
`;

您可以轻松提取您的姓名和电子邮件,如下所示:

代码语言:javascript
复制
const name = a.match(/Name\s+(.*?)\n/, 'm')[1].trim();
const email = a.match(/Email\s+(.*?)\n/, 'm')[1].trim();

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/61776054

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档