首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >S3DistCp可以合并.snappy.paruqet文件吗?

S3DistCp可以合并.snappy.paruqet文件吗?
EN

Stack Overflow用户
提问于 2017-06-02 11:05:56
回答 1查看 274关注 0票数 2

S3DistCp是否可以将多个由火花应用程序存储为.snappy.parquet输出的文件合并为一个文件,并使结果文件可由配置单元读取?

EN

回答 1

Stack Overflow用户

发布于 2018-12-13 00:36:50

我还试图将较小的快捷拼图文件合并为较大的快捷拼图文件。使用aws emr添加步骤--集群id {clusterID} --步骤file://filename.json和aws emr wait -complete--集群id {clusterID} --步骤id {stepID}

命令运行得很好,但是当我尝试使用parquet tools读回合并的文件时,read失败并返回java.io.EOFException。

联系AWS支持团队。他们说,在拼花地板文件上使用s3distcp时,他们有一个已知的问题,他们正在进行修复,但没有修复的预计时间。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/44320150

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档