我正在为一家公司做简历入围项目。我有整个公司文档的概念图。我还从简历中提取了数据,现在我有了每个简历的概念图。我想将每份简历与公司概念图进行比较,以便获得与公司相关的订单。谁能告诉我概念图比较算法?
发布于 2013-03-22 11:30:41
当谈到比较时,你通常需要一个距离/相似性度量。如果你能分辨出你正在尝试比较的是什么,以及你是否已经定义了一些相似性度量,这将是非常有帮助的。
发布于 2014-07-02 18:10:46
这是一个相当古老的问题,但也许我的建议对其他人有帮助。在此特定示例中,不可能看到公司CM的所有元素,因此此建议可能是不正确的。
假设两个CM都以文本格式以图形或树的形式存储。我的想法是简单地计算(使用蛮力)那些出现在两个CMs中的概念。在CV图中,您可以根据公司需求确定各个分支中概念的具体权重。例如,“课外活动”中的概念重叠可以乘以值0.25,而“技术”中的概念重叠可以乘以值0.75。
在计算时,我会从CV图的第三层开始,因为我可以看到,前两层的概念在公司CM中是不存在的。您将搜索公司CM树的所有分支,并计算两个映射中每个概念的出现次数。每个CV CM的总值等于重叠的总和(用特定CV分支的“值”进行归一化)。最后,只需根据计算出的总值对CV进行排序即可。
https://stackoverflow.com/questions/13485753
复制相似问题