我的公司名称如下:
1.苹果公司2.苹果电脑公司3.苹果4. Inc 5.国际商业机器4.国际商业机器公司5.国际商业机器公司6. Inc公司
我需要将文本与正确的公司名称匹配,并将所有其他相似项替换为正确的公司名称...is。
发布于 2013-08-25 02:00:29
有一个执行名称匹配的python library。
> choices = ["Atlanta Falcons", "New York Jets", "New York Giants", "Dallas Cowboys"]
> process.extract("new york jets", choices, limit=2)
[('New York Jets', 100), ('New York Giants', 78)]
> process.extractOne("cowboys", choices)
("Dallas Cowboys", 90)发布于 2013-07-07 13:17:43
maybe this might help?这是一个python diff库。
你可以计算每个字符串之间的差异,如果两个字符串高度相似,那么你可能(注意可能)假设,由于它们有很多共同点,它们可能是同一个公司。
https://stackoverflow.com/questions/17509496
复制相似问题