首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Sqoop和Vertica

Sqoop和Vertica
EN

Stack Overflow用户
提问于 2015-11-16 23:52:59
回答 2查看 1K关注 0票数 0

这里有人使用过sqoop和hp vertica吗?

我正在尝试将数据从sqoop导出到vertica,但我发现性能非常差。

我可以切换到HP vertica连接器...但我仍然想知道为什么sqoop在将数据导出到vertica时运行如此缓慢。

我还发现,在插入数据时,sqoop不支持针对vertica的upsert。我想知道这个问题是否会很快得到解决?

代码语言:javascript
复制
sqoop export -Dsqoop.export.records.per.statement=1 --driver 
com.vertica.jdbc.Driver --mysql-delimiters  --username **** --password **** --
connect jdbc:vertica://hostname/schema?ConnectionLoadBalance=1 --export-dir <hdfs-
data-dir> --table <table_name>

其中一个问题是sqoop迫使我们将Vertica的sqoop.export.records.per.statement设置为1。否则它会抛出一个错误。

EN

回答 2

Stack Overflow用户

发布于 2016-02-17 03:19:48

我从未使用过sqoop,但vertica中的命令行数据导入功能使用了复制功能;基本上它会创建一个临时文件,然后在后台执行文件导入。这不是一个很好的解决方案,但是您可以尝试将数据转储到gzip,然后直接运行复制功能。我发现gzip总是超过某个阈值(~50Mb+)的文件的瓶颈,而不是副本。可能是通向更快导入的后门。

票数 0
EN

Stack Overflow用户

发布于 2017-01-24 03:28:08

我使用的是vertica数据库的sqoop,我使用sqoop将数据从vertica导出到hive/HDFS,然后它就可以工作了,您只需要将vertica jar添加到sqoop文件夹中即可。当我想对HDFS/Hive中的数据进行asq vertica时,我使用vertica的hcatalog。在版本8.1.*中,它与vertica数据库一起提供,您不需要更多的连接器。

hcatalog

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/33739404

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档