我在看谈ETL的缺点和卡夫卡平台提供的解决方案,但我不太明白她说的是什么意思
ETL工具已经存在了十年,但是仓库中的数据覆盖率仍然很低。
在这种情况下,‘数据覆盖’意味着什么?她是否想说,并非所有数据库的数据最终都被转移到数据仓库?
发布于 2018-05-01 13:32:29
是的,我就是这么解释的。存储在数据仓库中的数据是从主要来源导入的。引入数据所需的工作并不简单,因此许多源数据在数据仓库中不可用。通常,这意味着您可能有每个客户的每个地址,但您没有任何出生日期,例如。这并不是说您在模型的范围内缺少了数据片段。这或多或少地否定了仓库的价值。
https://softwareengineering.stackexchange.com/questions/370260
复制相似问题