不久前,我遇到了这个ML框架,它已经实现了几个可以使用的不同算法。该站点还提供了一个方便的API,您可以使用API键访问该API。
我需要这个框架来解决一个网站分类问题,我基本上需要根据它们的HTML内容对数千个网站进行分类。因为我不想被绑定到他们现有的API,所以我想使用框架来实现我自己的API。
然而,除了一些入门级的数据挖掘课程和相关的阅读之外,我对我需要使用的内容知之甚少。具体来说,我不知道我到底需要做什么来训练分类器,然后对数据进行建模。
这个框架已经包含了一些分类算法,比如NaiveBayes,我知道这些算法非常适合文本分类的任务,但我不太清楚如何将它应用于这个问题。
有人能给我一个粗略的指引,说明我需要做些什么才能完成这个任务吗?
发布于 2016-11-10 15:20:22
您可以使用task.first的文本分类类,确定如何对这些网站进行分类。(即作为体育网站、健康和财富网站等).Get一些培训数据并对其进行培训和完成。
https://datascience.stackexchange.com/questions/2564
复制相似问题