我使用AWS上的sqoop将20亿条记录从hive导出到Oracle数据库。我已经尝试过--batch和--num-mappers参数,它们已经帮助提高了性能。
调优-Dsqoop.export.statements.per.transaction和-Dsqoop.export.records.per.statement有帮助吗?
期待有关其他调优参数的建议,以提高出口吞吐量。
发布于 2017-10-29 16:22:40
你试过包括--direct选项吗?我已经看到,这将提高Oracle导入中的性能,这取决于您的oracle版本。
发布于 2017-10-29 19:49:43
调优
-Dsqoop.export.statements.per.transaction和-Dsqoop.export.records.per.statement有帮助吗?
sqoop.export.records.per.statement“(可能会遇到java.lang.OutOfMemoryError),并开始调整"sqoop.export.statements.per.transaction”。尝试每一种方法,并采用适合你的方法。
https://stackoverflow.com/questions/47000611
复制相似问题