我正在尝试合并具有不同架构的两个csv文件(在Azure数据工厂中)。以下是场景
CSV1: 15列->表示5个维度和10个度量(x1,x2,...x10) CSV 2: 15列-> 5个维度(同上)和10个度量(与上面不同,y1,y2...y10),所以我的模式是不同的。现在我必须合并两个CSV文件,以便所有20个度量只有5个维度。
我尝试使用Select操作进行数据转换。这在合并文件中给了我2行。一行包含前5个维度和10个度量,第二行包含下一个5个维度和10个度量,这是不正确的,因为我只查找一行包含5个维度和所有20个度量(x1,x2...x10,y1,y2...y10)
在这个问题上任何帮助都是非常感谢的
发布于 2021-09-15 08:22:11
感谢您@sac的更新,并感谢您@Joel Cochran的建议。将其发布为帮助其他社区成员的答案。
Join转换和连接类型作为。使用2个输入文件中的键列或公共列(尺寸列)作为联接条件。这将输出file1和file2中的所有列。Select转换从连接输出中获取所需的。具体实施请参考以下流程:
(i) Join 2源文件,在join条件中包含内部join和键列。

(Ii) Join转换的输出将列出source1中的所有列和source2中的所有列(包括来自两个源文件的重复键列)。

(iii)使用select转换并从Join输出中删除重复的(或在选择列表中不需要)列。

(Iv)选择转换的输出。

https://stackoverflow.com/questions/69092037
复制相似问题