我正在使用用于ETL的TALEND Bigdata studio。
我有一个案例,我需要在两个数据集之间进行完全的外连接,但在talend studio中,我找不到完整的外连接选项。
我该怎么做呢?
发布于 2016-04-27 18:35:13
编辑:
在tMap中,当您映射来自两个表的两列时,您就有了两个表。父主流表(左侧表格堆栈中的第一个),以及引用父表的子表。
诀窍很简单。您知道,当您将属性从父表拖放到子表时,您将获得一个连接,并且在子表属性中,您将获得要匹配的父表属性的名称。这里的技巧是在子表中有一个映射关系,它不是到父表,而是到任何其他东西(比如上下文变量),它总是会产生true。
我通常会在子流中添加一个额外的bool属性(不是来自源代码),并且在缺省情况下设置为true,而在tMap中的子映射中,我会将其“联接”为true。
结果是所有记录连接尝试都被解释为成功连接,您将获得笛卡尔乘积连接结果
https://stackoverflow.com/questions/36858354
复制相似问题