我有一些数据不一致的数据库。这个数据库汇总了10.000家工业企业10年来的不同变量(例如,员工数量、能源消耗、资产价值,以及另外83个变量)。我的问题是,随着时间的推移,公司会改变国际标准行业分类(ISIC)的代码,我需要将相同的代码放到公司中,以便进行连贯的分析。

在图像中,您可以看到公司987653如何具有两个不同的ISIC代码(纺织品和食品制造)
可以有一些帮助来创建一个公式,以基于最重复的值来放置新的ISIC代码(在公司的例子中,987653将是食品制造)。
发布于 2020-03-21 01:27:18
你可以尝试下面的数组公式来查找最常用的代码:
{=INDEX($D$2:$D$23,MODE(IF($A$2:$A$23=A2,MATCH($D$2:$D$23,$D$2:$D$23,0))))}按ctrl + shift + enter确认编辑后的数组公式

发布于 2020-03-21 02:29:07
一个简单的VLOOKUP应该可以做你想做的事情,如果你可以接受为公司使用第一个ISIC的话。例如:
F2: =VLOOKUP(B2,$B$1:$E$10,4,FALSE)

https://stackoverflow.com/questions/60778065
复制相似问题