我在excel中有两个数据集,我想加入其中,但有一个主要的问题。下面是我的数据的样子:

请注意几件事: 1-对于ID 3,sheet1中的电话与sheet2中的不同;2- ID 4在sheet2中有电话号码,但在sheet1中没有电话号码
我想要的是这两张纸的组合,将包含所有的信息。因此,缺少的值将被填充,每当同一ID有两个不同的值时,我希望rapidminer创建一个包含另一个值的附加列(例如: phonenumber1,phonenumber2)。
请注意,我不是一个非常技术性的人,因此让我知道,如果有一个简单的解决方案,如果它是复杂的,解释我需要做的详细步骤。
谢谢!
发布于 2016-08-19 00:12:35
如果您正确设置了Join操作符的参数,它将执行您想要的操作。首先,在读取电子表格之后,将两个示例集连接到Join操作符。对于left和right键,将该操作符的key attributes设置为ID和age。接下来,清除remove double attributes参数。
运行流程后,您应该会看到其他列。
https://stackoverflow.com/questions/39016657
复制相似问题