关于数据仓库中的ETL (特别是摘录),我有一个问题。
从这个文章中,一个临时区域主要是由于时间的原因,有些甚至不需要一个临时区域。
假设我有3台微服务服务器,每个服务器都有自己的数据库、2台操作服务器和1台数据仓库服务器。
谁将开始提取数据?我的想法是
但我不确定是否应该向所有操作服务器提供API并让它们决定何时向仓库发送数据?或者直接从操作数据库中提取数据是所有数据仓库服务器的工作?如果是的话,如何提取实时的呢?
发布于 2021-04-27 18:57:06
您提出的方法(每天ping服务器1,但几乎实时地从服务器2接收数据)是我在过去看到的。不过,您可能需要考虑的一些事情是:
https://stackoverflow.com/questions/67276882
复制相似问题