文章/答案/技术大牛

发布

社区首页 >问答首页 >从MongoDB向Hadoop发送数据的有效方法是什么？

问从MongoDB向Hadoop发送数据的有效方法是什么？
EN

Stack Overflow用户

提问于 2014-01-07 09:19:54

回答 2查看 904关注 0票数 1

我和一位同事讨论了MongoDB连接器在Hadoop中的使用问题，他解释说这是非常低效的。他说，MongoDB连接器使用它自己的映射减少，然后使用Hadoop映射减少，这在内部减缓整个系统。

如果是这样，那么将我的数据传输到Hadoop集群的最有效方法是什么？如果MongoDB连接器效率更低，它有什么用途？在我的场景中，我希望从MongoDB (大约10 my )获取每日插入的数据，并将其全部放入Hadoop中。我还应该指出，每个MongoDB节点和Hadoop节点都共享相同的服务器。

mongodb

hadoop

回答 2

Stack Overflow用户

回答已采纳

发布于 2014-01-07 13:55:57

Hadoop的MongoDB连接器直接从MongoDB读取数据。您可以配置多个输入分裂来并行读取同一集合中的数据。Mapper和Reducer作业由Hadoop的Map/Reducer引擎运行，而不是MongoDB的Map/Reducer。

如果数据估计是正确的(每天只有10 is？)这是一个很小的摄入量，如果没有计算任何输入分割，任务可能会更快。

您应该警惕Hadoop和MongoDB在同一台服务器上争夺资源，因为争夺内存或磁盘会影响数据传输的效率。

票数 2

Stack Overflow用户

发布于 2015-04-26 19:09:01

要将您的数据从Mongodb传输到Hadoop，您可以使用一些ETL工具，比如Talend或Pentaho，它更简单、更实用！祝你好运！

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/20967836

复制

相似问题

问从MongoDB向Hadoop发送数据的有效方法是什么？
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问从MongoDB向Hadoop发送数据的有效方法是什么？EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问从MongoDB向Hadoop发送数据的有效方法是什么？
EN