首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用MAP还原JAVA解析平面Json文件

使用MAP还原JAVA解析平面Json文件
EN

Stack Overflow用户
提问于 2017-11-01 15:23:25
回答 2查看 771关注 0票数 0

我的任务是从HDFS中解析Json对象,并在HDFS中编写单独的文件。下面是我的密码。

代码语言:javascript
复制
package com.main;

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import org.json.JSONException;
import org.json.JSONObject;

public class JsonMain {

    public static class Mapperclass extends Mapper<LongWritable, Text, Text, Text>{

        public void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException{

            String regId;
            String time;
            String line = value.toString();
            String[] tuple = line.split("\\n");
            try{
                for(int i=0;i<tuple.length; i++){
                    JSONObject obj = new JSONObject(tuple[i]);
                    regId = obj.getString("regId");
                    time = obj.getString("time");
                    context.write(new Text(regId), new Text(time));
                }
            }catch(JSONException e){
                e.printStackTrace();
            }
        }
    }

    public static void main(String[] args) throws IOException, ClassNotFoundException, InterruptedException {
        // TODO Auto-generated method stub

        Configuration conf = new Configuration();
        Job job = Job.getInstance(conf, "word count");

        job.setJarByClass(JsonMain.class);
        job.setMapperClass(Mapperclass.class);
        //job.setCombinerClass(IntSumReducer.class);        
        //job.setReducerClass(IntSumReducer.class);

        job.setOutputKeyClass(Text.class);
        job.setOutputValueClass(IntWritable.class);

        FileInputFormat.addInputPath(job, new Path(args[0]));
        FileOutputFormat.setOutputPath(job, new Path(args[1]));

        System.exit(job.waitForCompletion(true) ? 0 : 1);
    }
}

Flatjson.txt

代码语言:javascript
复制
{"regId":"TbEtvRH""time":1509073895112}
{"regId":"lWJ2u0j""time":1509073905112}
{"regId":"uB9WG5K""time":1509073915112}
{"regId":"9sO7aqg""time":1509073925113}
{"regId":"hguOaKh""time":1509073935113}
{"regId":"p1CAzYt""time":1509073945113}
{"regId":"quDVMkD""time":1509073955113}

注意:我已经在我的项目中包含了所有的依赖Jar。

执行了以下命令: hadoop jar JsonMapper.jar com.main.JsonMain /user/cloudera/FlatJson/Flatjson.txt output007

下面是正在获取的错误消息。

代码语言:javascript
复制
17/11/01 08:11:12 INFO mapreduce.Job: The url to track the job: http://quickstart.cloudera:8088/proxy/application_1509542757670_0003/
17/11/01 08:11:12 INFO mapreduce.Job: Running job: job_1509542757670_0003
17/11/01 08:13:33 INFO mapreduce.Job: Job job_1509542757670_0003 running in uber mode : false
17/11/01 08:13:33 INFO mapreduce.Job:  map 0% reduce 0%
17/11/01 08:15:32 INFO mapreduce.Job: Task Id : attempt_1509542757670_0003_m_000000_0, Status : FAILED

Error: java.lang.ClassNotFoundException: org.json.JSONException
    at java.net.URLClassLoader$1.run(URLClassLoader.java:366)
    at java.net.URLClassLoader$1.run(URLClassLoader.java:355)
    at java.security.AccessController.doPrivileged(Native Method)
    at java.net.URLClassLoader.findClass(URLClassLoader.java:354)
    at java.lang.ClassLoader.loadClass(ClassLoader.java:425)
    at sun.misc.Launcher$AppClassLoader.loadClass(Launcher.java:308)
    at java.lang.ClassLoader.loadClass(ClassLoader.java:358)
    at java.lang.Class.forName0(Native Method)
    at java.lang.Class.forName(Class.java:270)
    at org.apache.hadoop.conf.Configuration.getClassByNameOrNull(Configuration.java:2138)

"java.lang.ClassNotFoundException: org.json.JSONException“==>我在我的项目中导入了这个jar。告诉我这是怎么回事。

EN

回答 2

Stack Overflow用户

发布于 2017-11-01 21:04:26

让我们开始分步骤调试您的问题。

  1. 请执行jar -tvf JsonMapper.jar \ grep JSONException,您将看到jar中不存在这个类。
  2. 请务必理解,通过像mvn这样的依赖管理系统在项目中包含一个依赖项并不能保证它在jar中的可用性。
  3. 请使用阴影插件将依赖项中的所有jar包含到您的阴影脂肪罐中。
票数 1
EN

Stack Overflow用户

发布于 2017-11-03 09:10:06

“错误: java.lang.ClassNotFoundException: org.json.JSONException”->这个问题已经解决了。

以前,我的jar在/home/jar/java-json.jar路径中。

我已经将这个jar移动到"/usr/lib/hadoop-mapreduce/“这个路径,并包含这个jar,并将这个jar添加到它工作的项目中。

cp java-json.jar /usr/lib/hadoop

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/47058224

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档