我想从我们拥有的不同合同文件中提取各种金额和合同期限。
例如:
本合同有效期为3个月,必须在1个月内执行。你必须支付$3000作为合同费,$60作为税,$1200作为保证金,$1200作为租金
预期产出:合同任期:3个月,支付金额:3060美元
请注意:我尝试了NER,但这显示了2个终身和2个金额。然而,我正在寻找一种技术,通过它,我们可以将金额与合同联系起来。
发布于 2020-04-27 20:42:10
标准的NER将提取单个实体,在这种情况下是时间(3个月,1个月)和货币($3000,等等)。您还需要考虑关系提取,它确定了两个文本之间是如何相互关联的。例如,从欧氏距离测度来看,“合同”与“有效”和“执行”有关,“有效”与“3个月”有关,而“执行”则涉及“1个月”。根据您想要的输出应该是什么,您需要训练您的模型来计算“合同”和“3个月”之间的最短距离,在这种情况下,这意味着教它寻找“有效”,而忽略“执行”。有不同的方法来做这件事,你会想要考虑什么对你的文本集最有效。
下面是一个让您开始工作的链接 (还包括指向其他资源的链接)。
https://datascience.stackexchange.com/questions/72862
复制相似问题