我知道我最近问了几个与pentaho相关的问题,但我急于在短时间内对其进行评估:)
我试图克服的最新障碍是,我正在构建一个作业,它将在输入文件到达时对其进行处理,但我只知道文件名的格式,而不知道确切的文件名本身,并且“等待文件”步骤不允许使用通配符。这似乎是对这一步的明显误解,所以我想知道我是不是错过了什么,但在论坛等方面,似乎我并不是唯一一个面临这样挑战的人。
理想情况下,我需要"wait for file“步骤来搜索通配符/正则表达式,当找到匹配的文件名时,将结果文件名传递给作业中的下一步进行处理。
有什么建议吗?
谢谢
汤姆
发布于 2011-05-28 00:21:31
我再一次尝试回答你的问题。
实际上,您不需要一个作业来等待文件。根据我对country split的回答:Pentaho Spoon - Output to multiple files based on field content,您只需要传递源代码名称,然后使用进程文件将其存档(参见下面的图片)。

从这里开始,我认为您可以使用我之前提供的ktr (http://pentaho.phi-integration.com/kettle/kettle-files/split_countries.ktr)来调整我的逻辑。
然后,您可以使用作业调度程序(参见图片)控制作业(等待和处理文件)的重复。

好吧,希望这能帮到汤姆!
致以敬意,
恐龙
发布于 2011-08-24 21:22:58
我有类似的需求,并通过创建一个专门用于(从远程主机)接收文件的目录来解决这个问题。
"Get File Names“步骤读取目录中的文件,并将名称传递到下一步。“获取文件名”允许使用通配符,顺便说一下。
(当然,一旦处理完文件,我就必须清理输入队列中的文件。)
编辑:我忘了提到,你失去了“唤醒”功能的Get文件名,你将不得不循环和计划定期解析的目录。
https://stackoverflow.com/questions/6153091
复制相似问题