首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >简历解析-利用机器学习从简历中提取技巧

简历解析-利用机器学习从简历中提取技巧
EN

Data Science用户
提问于 2018-08-04 05:27:37
回答 1查看 24K关注 0票数 8

我试图从他/她的简历中提取员工的一套技能。我已将简历作为纯文本存储在数据库中。在这种情况下,我没有预定义的技能。我应该如何处理这个问题?

我能想到两种方法:

  1. 使用无监督的方法,因为我没有预定义的技能与我。我将使用主题建模从简历中提取技能,但如果我没有错,则使用弓式方法,这种方法在这种情况下可能没有用,因为这些技能几乎不会出现一两次。(如果你能给我更多关于主题建模的启发,我将不胜感激)。
  2. 另一种方法是手动标记简历的技能,并使其成为监督学习问题。但我有大约500份简历,手工标注将非常乏味和非常耗时。

欢迎任何建议。

谢谢。

EN

回答 1

Data Science用户

回答已采纳

发布于 2018-08-04 10:15:57

我不确定主题建模会在这里帮助您,因为它试图从文本中提取抽象主题。恐怕简历太“干”了,不能很好地运行。

以下是我发现的一些可能有帮助的消息来源:

  • 一个简历解析器
  • 这个职位的答复,它为您提供了一些文本挖掘基础(如您之前所说的那样,如何处理文本数据、对其执行哪些操作等等)
  • 关于技能提取的本论文,我还没有读过,但是它可以给你一些想法

关于一些个人建议:

我要做一个假设,你不想用手给那些简历贴上标签,我会先解释一下我会怎么做。这可能不是最好的解决方案,因为它有很多启发,但这是一个开端,主要是为了研究你的数据,并从中获得一些洞察力。

  • 您可以看到文档的结构是否有用:您要寻找的技能可能经常出现在具有特定标题的部分中。
  • 你也可以使用gazeteers,这是感兴趣的关键词的列表,并将它们与座谈会(一组经常出现在一起的单词组)结合起来。例如,如果你有一个关键字出现在你的地名词典中,你可以用纳克来看它周围出现最多的单词,并把你的单个单词匹配变成一个多字技能(例如:机器学习(2克),自然语言处理(3克)等等)。
  • 一旦你有了一个有趣的关键字列表,你可以移动到ML,尝试单词向量,也许使用word2vec,并围绕你感兴趣的单词构建向量。如果有新的技能出现,它们的向量可能与您定义的类似(抱歉,这里有点不清楚,我只对word2vecs的工作方式有一个模糊的了解)。

这不是灵丹妙药,但这应该能让你开始。

祝你好运!

票数 12
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/36447

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档