我只是在浏览一些微软文档,并为数据工程相关的事情做handOn。我对一个场景有几个查询-“将CSV文件从Blob存储复制到Synapse分析(阶段表):
我读到我们可以通过创建外部表的过程在Synapse中进行直接数据拉取。(https://docs.microsoft.com/en-us/azure/synapse-analytics/sql-data-warehouse/load-data-wideworldimportersdw)
如果上面是可能的,那么在什么情况下我们使用Azure数据工厂复制或数据流方法?在使用Azure数据工厂时,使用Polybase是不是一个好主意,因为它将在此场景中再次使用Blob存储作为登台(即,我仅从Blob复制文件,然后再次使用blob进行登台)?
我搜索了我的问题的答案,但还没有找到任何令人满意的答案。
发布于 2020-08-04 07:56:42
如果您只是直接将数据从CSV加载到DW中,请使用Copy。建议使用Polybase,但对于小文件并不总是需要。
如果需要转换数据或执行更新,则使用数据流。
https://stackoverflow.com/questions/63234686
复制相似问题