嗨,我是数据挖掘的新手。我的任务是使用n-gram方法对文本文档进行自动分类。
我找不到关于这个主题的适当资源,请帮助我如何继续这个主题,我在哪里可以找到基于n-gram分类的教程。
我需要关于这个主题的java源代码作为我的理解。
提前谢谢。
发布于 2013-11-13 16:58:22
我强烈推荐Dan Jurafsky和Chris Manning的Stanford's online NLP course。第四章介绍了n-gram,但它之前的所有章节都提供了很好的背景。
斯坦福大学也有一些很好的open source software,可以用于文本分类,从标记化到词性标记。
发布于 2013-11-18 19:00:03
中找到了更好的文档教程。
http://textcat.sourceforge.net/README.txt
http://textcat.sourceforge.net/doc/index.html
https://stackoverflow.com/questions/19946897
复制相似问题