首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >hadoop - vertica jar

hadoop - vertica jar
EN

Stack Overflow用户
提问于 2015-06-03 20:27:48
回答 1查看 327关注 0票数 0

我想把数据从Vertica传输到蜂巢。根据手册,应将下列内容作为输入格式:

代码语言:javascript
复制
-inputformat com.vertica.hadoop.deprecated.VerticaStreamingInput 

但是hadoop有org.apache.hadoop.vertica.VerticaStreamingInput类,而不是上面的类。

因此,它抛出了以下例外:

代码语言:javascript
复制
Exception in thread "main" java.lang.RuntimeException:
  class org.apache.hadoop.vertica.VerticaStreamingInput not
  org.apache.hadoop.mapred.InputFormat

完整的命令是:

代码语言:javascript
复制
$HADOOP_HOME/bin/hadoop jar $HADOOP_HOME/contrib/streaming/hadoop-streaming-*.jar \  
-libjars $HADOOP_HOME/lib/hadoop-vertica.jar \   
-Dmapred.vertica.hostnames=VerticaHost \  
-Dmapred.vertica.database=ExampleDB \  
-Dmapred.vertica.username=ExampleUser \  
-Dmapred.vertica.password=password123 \  
-Dmapred.vertica.port=5433 \  
-Dmapred.vertica.input.query="SELECT * FROM allTypes ORDER BY key" \   
-Dmapred.vertica.input.delimiter=, \   
-Dmapred.map.tasks=1 \  
 -inputformat com.vertica.hadoop.deprecated.VerticaStreamingInput \  
 -input /tmp/input -output /tmp/output -reducer /bin/cat -mapper /bin/cat

蜂巢为CDH-4.4.0-1.cdh4.0.0.p0.39/环境,vertica为7.1。

如果我搞错了,哪里能找到正确的?如果这不是问题所在,我做错了什么?

那么这个com.vertica.hadoop.deprecated.VerticaStreamingInput类从何而来呢?我是从安装Vertica连接器获得的。(第9页,步骤5) HadoopIntegration.pdf

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-06-04 16:48:56

我刚刚从MapReduce下载了my.vertica.com上的下载页面的Hadoop。我采用了2.0版本(它支持CDH 4),因为这是您说要使用的Hadoop版本。

我在下载的文件中查看了hadoop-vertica.jar文件(yarn_1.6.0.zip),它的类文件位于正确的位置(com.vertica.hadoop.deprecated)。zip文件还包括源代码,因此您可以检查它。

我不知道org.apache.hadoop.vertica.VerticaStreamingInput是从哪里来的,但是下载连接器的新副本会解决您的问题。确保下载JDBC驱动程序并执行文档中描述的其他Java配置。

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/30630030

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档