文章/答案/技术大牛

发布

社区首页 >问答首页 >不能将Mahout minhash org.apache.hadoop.io.LongWritable转换为org.apache.hadoop.io.Text

问不能将Mahout minhash org.apache.hadoop.io.LongWritable转换为org.apache.hadoop.io.Text
EN

Stack Overflow用户

提问于 2013-09-11 08:21:27

回答 1查看 598关注 0票数 0

我正在使用：

hadoop-1.2.1和mahout-distribution-0.8

当我尝试使用以下命令运行HASHMIN方法时：

$MAHOUT_HOME/bin/mahout org.apache.mahout.clustering.minhash.MinHashDriver -i tce-data/cv.vec -o tce-data/out/cv/minHashDriver/ -ow

我得到了这个错误：

tce@osy-Inspiron-N5110:~$ $MAHOUT_HOME/bin/mahout org.apache.mahout.clustering.minhash.MinHashDriver  -i  tce-data/cv.vec  -o tce-data/out/cv/minHashDriver/ -ow
Warning: $HADOOP_HOME is deprecated.

Running on hadoop, using /home/tce/app/hadoop-1.2.1/bin/hadoop and HADOOP_CONF_DIR=
MAHOUT-JOB: /home/tce/app/mahout-distribution-0.8/mahout-examples-0.8-job.jar
Warning: $HADOOP_HOME is deprecated.

13/09/10 18:17:46 WARN driver.MahoutDriver: No org.apache.mahout.clustering.minhash.MinHashDriver.props found on classpath, will use command-line arguments only
13/09/10 18:17:46 INFO common.AbstractJob: Command line arguments: {--endPhase=[2147483647], --hashType=[MURMUR], --input=[tce-data/cv.vec], --keyGroups=[2], --minClusterSize=[10], --minVectorSize=[5], --numHashFunctions=[10], --numReducers=[2], --output=[tce-data/out/cv/minHashDriver/], --overwrite=null, --startPhase=[0], --tempDir=[temp], --vectorDimensionToHash=[value]}
13/09/10 18:17:48 INFO input.FileInputFormat: Total input paths to process : 1
13/09/10 18:17:50 INFO mapred.JobClient: Running job: job_201309101645_0031
13/09/10 18:17:51 INFO mapred.JobClient:  map 0% reduce 0%
13/09/10 18:18:27 INFO mapred.JobClient: Task Id : attempt_201309101645_0031_m_000000_0, Status : FAILED
java.lang.ClassCastException: org.apache.hadoop.io.LongWritable cannot be cast to org.apache.hadoop.io.Text
    at org.apache.mahout.clustering.minhash.MinHashMapper.map(MinHashMapper.java:30)
    at org.apache.hadoop.mapreduce.Mapper.run(Mapper.java:145)
    at org.apache.hadoop.mapred.MapTask.runNewMapper(MapTask.java:764)
    at org.apache.hadoop.mapred.MapTask.run(MapTask.java:364)
    at org.apache.hadoop.mapred.Child$4.run(Child.java:255)
    at java.security.AccessController.doPrivileged(Native Method)
    at javax.security.auth.Subject.doAs(Subject.java:415)
    at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1190)
    at org.apache.hadoop.mapred.Child.main(Child.java:249)

我很感谢你的任何想法

hadoop

mahout

minhash

回答 1

Stack Overflow用户

发布于 2013-10-24 16:33:34

然后交叉检查几件事，你的job.setOutputKeyClass、job.setOutputValueClass、job.setMapOutputKeyClass和job.setMapOutputValueClass应该分别与reducer键、reducer值、映射器键和映射器值类匹配。

堆栈跟踪显示Mapper中存在不匹配。您的MinHashMapper应该扩展Mapper<[A, B, C, D >]，其中C和D与job.setMapOutputKeyClass(C)和job.setMapOutputValueClass(D)相同

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/18730808

复制

相似问题

问不能将Mahout minhash org.apache.hadoop.io.LongWritable转换为org.apache.hadoop.io.Text
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问不能将Mahout minhash org.apache.hadoop.io.LongWritable转换为org.apache.hadoop.io.TextEN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问不能将Mahout minhash org.apache.hadoop.io.LongWritable转换为org.apache.hadoop.io.Text
EN