我试图在现场实例上运行mapreduce作业。我使用StarClusters及其hadoop插件启动我的实例。我没有问题上传数据,然后将其放入HDFS,然后将结果从HDFS复制回来。我的问题是,是否有方法直接从s3加载数据并将结果推回s3?(我不想手动将数据从s3下载到HDFS,并将结果从HDFS推送到s3,在后台有方法吗)?
我使用的是标准的麻省理工学院星团
发布于 2015-05-04 06:36:17
您不能这样做,但是您可以编写一个脚本来完成这个任务。例如,您可以使用:Hadoopdiscps3n://ID:key@mybucket/ file /user/root/file将文件直接从s3放到hdfs
https://stackoverflow.com/questions/29997056
复制相似问题