首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用逻辑应用程序从所有子(子)文件夹中获取特定文件,将其加载到SQL-Azure

使用逻辑应用程序从所有子(子)文件夹中获取特定文件,将其加载到SQL-Azure
EN

Stack Overflow用户
提问于 2017-04-18 23:36:37
回答 2查看 2.5K关注 0票数 3

我对数据工厂和逻辑应用程序非常陌生(但我使用SSIS已经有很多年的经验),

我成功地将一个包含100个文本文件的文件夹加载到SQL-Azure with DATA FACTORY中

但是文件本身是原封不动的。

现在,另一个要求是我循环遍历文件夹以获得具有特定文件扩展名的所有文件,最后我应该将所有文件从'To_be_processed‘文件夹移动(=复制和删除)到'Processed’文件夹

我找不到在哪里放“通配符”之类的东西:

例如,获取文件扩展名为.001、002、003、004、005、...until...,996,997,998,999 (千个文件) -->也搜索子文件夹。

可以从逻辑应用程序中调用数据工厂吗?(尽管这似乎没有必要)

请在此截图中找到更多详细信息:

(单击以放大)

提前感谢你帮我探索这项新技术!

EN

回答 2

Stack Overflow用户

发布于 2017-04-19 18:11:13

有趣的情况。

我同意仅仅为了这一额外的文件处理层而使用逻辑应用程序似乎是不必要的,但是Azure Data Factory目前可能无法处理您所需要的东西……

就向Azure数据工厂数据集添加通配符而言,您在JSON类型属性块中有3个可用的属性,如下所示。

Folder Path -指定目录。它可以与用于时间片开始和结束的partition by子句一起工作。必填项。

文件名-指定文件。它也可以与用于时间片开始和结束的partition by子句一起工作。不是必需的。

文件过滤器-这是通配符可以用于单个和多个字符的地方。(*)用于多个和(?)单人的。不是必需的。

更多信息请点击此处:https://docs.microsoft.com/en-us/azure/data-factory/data-factory-onprem-file-system-connector

我必须单独地说,以上这些都不是你所需要的理想,我已经反馈给微软,我们需要一个更灵活的属性,将上面的3个值组合成1,允许在不同的地方使用通配符,并根据条件进行分区,而不仅仅是日期时间值。

这就是说。试试下面这样的方法。

代码语言:javascript
复制
"typeProperties": {
  "folderPath": "TO_BE_PROCESSED",
  "fileFilter": "17-SKO-??-MD1.*" //looks like 2 middle values in image above
  }

顺便说一句,微软已经为一个文件move活动提出了一个反馈项目,目前正在审查中。

查看此处:https://feedback.azure.com/forums/270578-data-factory/suggestions/13427742-move-activity

希望这能有所帮助

票数 1
EN

Stack Overflow用户

发布于 2017-05-22 20:18:10

我们使用了一个通过“应用程序服务”-> webjobs调用的C#应用程序。更容易遍历文件夹。为了调用SQL,我们使用了sql bulkinsert

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/43476503

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档