首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在mallet中训练分类器

在mallet中训练分类器
EN

Stack Overflow用户
提问于 2012-08-11 00:17:14
回答 1查看 2.4K关注 0票数 3

我有一个csv文件,格式如下

productname,产品的评论

现在使用mallet,我必须训练分类器,以便如果给出一个包含产品评论的测试数据集作为输入,它应该告诉我特定评论属于哪个产品

将非常感谢mallet java api帮助。

EN

回答 1

Stack Overflow用户

发布于 2012-09-26 22:41:24

这里有一个适合你的小例子:

代码语言:javascript
复制
    public static void main(String[] args) throws IOException {
        //prepare instance transformation pipeline
        ArrayList<Pipe> pipes = new ArrayList<Pipe>();
        pipes.add(new Target2Label());
        pipes.add(new CharSequence2TokenSequence());
        pipes.add(new TokenSequence2FeatureSequence());
        pipes.add(new FeatureSequence2FeatureVector());
        SerialPipes pipe = new SerialPipes(pipes);

        //prepare training instances
        InstanceList trainingInstanceList = new InstanceList(pipe);
        trainingInstanceList.addThruPipe(new CsvIterator(new FileReader("datasets/training.txt"), "(.*),(.*)", 2, 1, -1));

        //prepare test instances
        InstanceList testingInstanceList = new InstanceList(pipe);        
        testingInstanceList.addThruPipe(new CsvIterator(new FileReader("datasets/testing.txt"), "(.*),(.*)", 2, 1, -1));

        ClassifierTrainer trainer = new NaiveBayesTrainer();
        Classifier classifier = trainer.train(trainingInstanceList);
        System.out.println("Accuracy: " + classifier.getAccuracy(testingInstanceList));
   }
票数 8
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/11905551

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档