首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何扩展Azure数据工厂数据流?

如何扩展Azure数据工厂数据流?
EN

Stack Overflow用户
提问于 2020-01-11 04:14:36
回答 2查看 532关注 0票数 0

我可以很容易地使用ADF UI为一个表设置SCD Type2流程,但我没有看到一种简单的方法来扩展到我们已经拥有的数千个数据源。我没有看到任何允许我编写ADF Pipeline/Dataflow并动态配置和触发它们的Java API。我查看了Azure Datalake Gen 2,Azure Databricks等。我在Azure中没有看到任何工具可以让我们取代我们内部构建的UI驱动的数据湖摄取过程。我是不是漏掉了什么?

顺便说一句,我们有一个旧的数据湖应用程序,它从数千个数据源(如数据库、日志文件、web应用程序等)中摄取数据,并使用Java、Spark、Kafka等技术在HDFS (一个典型的架构)上存储数据。我们正在评估Azure Active data Factory以取代它。

EN

回答 2

Stack Overflow用户

发布于 2020-01-11 06:41:16

ADF中内置了一个通用的SCD (类型1,但您可以改装为类型2)示例。转到New > Pipeline from template > Transform with数据流> Generic SCD Type1。

这里概述了这个模式:https://techcommunity.microsoft.com/t5/azure-data-factory/create-generic-scd-pattern-in-adf-mapping-data-flows/ba-p/918519

您还可以在管道内对Foreach的无模式表数据集进行迭代,在每次迭代中调用相同的数据流。

最后,如果您仍然希望以编程方式淘汰数据流,在线PowerShell文档的references部分中列出了.NET和Azure SDK。

票数 0
EN

Stack Overflow用户

发布于 2020-01-11 11:12:32

您可以利用Java中的REST API来使用代码构建管道。

https://docs.microsoft.com/en-us/azure/data-factory/quickstart-create-data-factory-rest-api

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/59688434

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档