首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何找出哪一种类别属于只有标题的要约?

如何找出哪一种类别属于只有标题的要约?
EN

Stack Overflow用户
提问于 2011-05-26 17:46:08
回答 1查看 157关注 0票数 2

我正在开发一项新服务,它将查询多个报价(Groupon等)。我想破译哪个类别属于这个提议。

示例:

我得到了这个标题:“阿克奎琳娜健康博览会

我试着玩http://www.google.com/insights/search/,但这并不容易,因为它只接收7个参数(术语),有时我们有无法分离的复合词。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2011-05-27 07:49:49

有一些基于Wordnet和搜索距离的有趣方法,但是标准的方法是贝叶斯垃圾邮件过滤方法。

步骤1:构造一个标题(或标题和正文)的示例集,以及您认为它属于什么类别。你做的越大,越多样化,这套就越好。你需要有很多不同的例子(比如说,至少一个两位数的数字,但最好是几百个)。如果您需要帮助构建这个集合,您可以使用Amazon的机器土耳其语,并付钱给其他人来进行分类。

步骤2:通过CRM114 (http://crm114.sourceforge.net/ )或类似的方法运行所有示例。如果您想使用云服务,我认为Google预测API允许使用文本字段。

步骤3:对于测试,不要让分类器查看所有示例。保持一些所谓的样本外集,你可以测试你的分类器。对于它来说,分类已经看过的东西要容易得多,所以你要确保你知道它在看不见的例子上有多好。有些分类器会自动为您进行此测试。

祝好运!

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/6142844

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档