我正在尝试构建一个简历解析器(从PDF到JSON)。在将pdf中的文本提取为一个长字符串之后,您将如何将字符串分割成不同的部分,比如红线显示。简历有不同的格式,人们对这些部分使用不同的标签。有什么机器学习技术我可以研究吗?谢谢!
。
发布于 2020-12-02 19:43:12
这是您的任务的著名实现之一。大多数情况下效果很好。如果你只需要这样一个工具,你可以使用它。但是,如果您想开发自己的工具,您可能需要分析它的结构。
它也能够在简历中寻找特定的技能,就像上面提到的这里。
在您的需求中,它接受pdf和文档,并返回json。
https://datascience.stackexchange.com/questions/86206
相似问题