首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >s3distcp srcPattern不工作?

s3distcp srcPattern不工作?
EN

Stack Overflow用户
提问于 2013-08-24 20:43:56
回答 1查看 2.4K关注 0票数 4

我在S3中有这样的文件:

代码语言:javascript
复制
1-2013-08-22-22-something
2-2013-08-22-22-something
etc

没有srcPattern,我可以很容易地从桶中获取所有的文件,但是我想获得一个特定的前缀,例如所有的1。我尝试过使用srcPattern,但出于某种原因,它没有收集任何文件。

我现在的命令是:

代码语言:javascript
复制
elastic-mapreduce --jobflow $JOBFLOW --jar /home/hadoop/lib/emr-s3distcp-1.0.jar \
--args '--src,s3n://some-bucket/,--dest,hdfs:///hdfs-input,--srcPattern,[0-9]-.*' \
--step-name "copying over s3 files" 
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2013-08-24 21:35:17

原来你需要.*在正则表达式前面

例如,我需要

代码语言:javascript
复制
.*[0-9]-.*

我猜是因为源模式也包含了桶名?

票数 8
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/18422951

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档