首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Liblinear如何使用它

Liblinear如何使用它
EN

Stack Overflow用户
提问于 2011-05-25 04:49:55
回答 1查看 530关注 0票数 4

总的来说,我在机器学习和文本挖掘方面还是个新手。这引起了我的注意,一个叫Liblinear https://github.com/tomz/liblinear-ruby-swig的ruby库出现了。

到目前为止,我想要做的是训练软件来识别文本是否提到任何与自行车有关的内容。

有人可以强调我应该遵循的步骤(即:预处理文本和如何),分享资源,并理想地分享一个简单的例子,让我继续下去。

任何帮助都可以,谢谢!

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2011-05-25 05:01:07

经典的方法是:

  1. 收集输入文本的代表性样本,每个样本标记为训练集和测试集。
  2. 提取训练集的所有文档中的所有术语;将其称为词汇。V.
  3. 对于训练集中的每个文档,将其转换为布尔向量,其中第i个元素为真/1如果词汇中的第i个术语出现在文档中。
  4. 将矢量化的训练集馈送到学习算法。

<代码>G211

现在,要对文档进行分类,请按照步骤4对其进行矢量化,并将其提供给分类器以获得相关/不相关的标签。将此标签与实际标签进行比较,看看是否正确。使用这种简单的方法,您应该能够获得至少80%的准确率。

要改进这种方法,可以将布尔值替换为术语计数,并按文档长度进行标准化,或者更好地替换为tf-idf分数。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/6116718

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档