首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >通过独特技术将数据摄取到HDFS中

通过独特技术将数据摄取到HDFS中
EN

Stack Overflow用户
提问于 2015-08-20 18:28:40
回答 1查看 87关注 0票数 3

我想将非半结构化数据(MS word/PDF/JSON)从远程计算机传输到hadoop(可能是批处理的,可能是接近实时的,但不是流的)。

我必须确保将数据从远程位置快速移动到我的本地计算机(低带宽工作)到HDFS或本地计算机。例如,Internet Download Manager有这个惊人的技术,可以与FTP建立多个连接,并通过更多的连接来利用低带宽。

hadoop生态系统是否有可能提供这样一种工具来将数据注入Hadoop。或者任何自制的技术?

哪种工具/技术可以更好。

EN

回答 1

Stack Overflow用户

发布于 2015-08-20 19:13:02

您可以使用Web HDFS API http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-hdfs/WebHDFS.html#Document_Conventions

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/32115785

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档