我正在尝试提出一种数据管道架构。我处理的数据是请求的、失败的、成功的实验室的事件日志,使用时间戳和几个不同客户的一些客户信息。最终,我希望将数据转储到仪表板中,供外部和内部使用。最好的方法是什么:事件驱动的或批处理驱动的ETL?我们不太关心实时处理,而且数据很小。
发布于 2022-02-08 06:46:30
如果实时ETL处理不重要,则使用批处理.您可以更容易地进行监视,因为您知道管道调度,并且通过将它调度到更安静的时间来节省硬件。
https://datascience.stackexchange.com/questions/107947
复制相似问题