我们正在为数据仓库项目进行数据准备活动,以构建企业级数据仓库。作为中间层,我们将所有源数据库信息作为单元表引入Hadoop datalake。
在我们的用例中,我们有3000+源代码表。我们希望将源数据合并到bigdata datalake中的一个新模式中。作为其中的一部分,我们需要对所有源数据库表进行数据分析/数据准备,方法是分析每一列,以便将/组映射到各自有意义的目标表中。
请专家就任何工具(开放源码或许可)提出建议,以简化流程。
谢谢你,Sakthivel
发布于 2022-09-12 12:07:27
为了更好地理解用例,这里有几个问题-
中进行处理吗?
https://stackoverflow.com/questions/73686667
复制相似问题