首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >将集合传递给FileIO.match().filepattern()

将集合传递给FileIO.match().filepattern()
EN

Stack Overflow用户
提问于 2019-07-10 00:28:59
回答 1查看 473关注 0票数 0

我有一个内部带有通配符的URL列表,如何将其传递给FileIO.match().filepattern(XXXX)

以下是代码

代码语言:javascript
复制
PCollectionTuple decompressOut =
  pipeline
    .apply(TextIO.read("dict.txt"))
    .apply("MatchFile(s)", FileIO.match().filepattern())
    .apply(
      "DecompressFile(s)",
      ParDo.of(new Decompress(options.getOutputDirectory()))
           .withOutputTags(
               DECOMPRESS_MAIN_OUT_TAG,
               TupleTagList.of(DEADLETTER_TAG)));

在dict.txt中,我有要传递给XXX的URL列表

EN

回答 1

Stack Overflow用户

发布于 2019-07-10 18:25:49

我相信您可以使用matchAll来读取包含文件名的PCollection。

来自Link to Beam Java doc中标题为"Example: Matching a PCollection of filepatterns From Kafka“的部分

代码语言:javascript
复制
 PCollection<String> filepatterns = p.apply(KafkaIO.read()...);

 PCollection<Metadata> matches = filepatterns.apply(FileIO.matchAll()
     .withEmptyMatchTreatment(DISALLOW));

将KafkaIO.read()替换为TextIO。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/56956986

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档