首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >优化sqoop导出性能

优化sqoop导出性能
EN

Stack Overflow用户
提问于 2017-10-29 13:17:21
回答 2查看 2.5K关注 0票数 0

我使用AWS上的sqoop将20亿条记录从hive导出到Oracle数据库。我已经尝试过--batch--num-mappers参数,它们已经帮助提高了性能。

调优-Dsqoop.export.statements.per.transaction-Dsqoop.export.records.per.statement有帮助吗?

期待有关其他调优参数的建议,以提高出口吞吐量。

EN

回答 2

Stack Overflow用户

发布于 2017-10-29 16:22:40

你试过包括--direct选项吗?我已经看到,这将提高Oracle导入中的性能,这取决于您的oracle版本。

票数 1
EN

Stack Overflow用户

发布于 2017-10-29 19:49:43

调优-Dsqoop.export.statements.per.transaction-Dsqoop.export.records.per.statement有帮助吗?

  1. 是。请参阅此链接:https://community.hortonworks.com/articles/70258/sqoop-performance-tuning.html 稍后,停止调整"sqoop.export.records.per.statement“(可能会遇到java.lang.OutOfMemoryError),并开始调整"sqoop.export.statements.per.transaction”。
  2. 导出性能取决于并行性的程度,所以增加映射器的数量,看看性能是如何提升的。 正如在partitioning中提到的那样,使用分区虽然已经很久了,但是在这个链接mbox/sqoop-user/201406.mbox/%3CCFCDC24C.A85D%25brenden.cobb@humedica.com%3E中也有类似的经验。
  3. 与前面的答案一样,使用“--直接”参数使用直接模式。

尝试每一种方法,并采用适合你的方法。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/47000611

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档