首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >垃圾邮件分类器Clojure

垃圾邮件分类器Clojure
EN

Stack Overflow用户
提问于 2018-10-31 19:46:54
回答 1查看 79关注 0票数 1

我一直在尝试在Clojure中实现垃圾邮件分类器。我一直在使用的参考书是“集体情报”。下面是训练分类器的训练方法:

代码语言:javascript
复制
(defn train
  [t cat]
 (incc cat)
 (let [ws (keys (getwords t))]
 (for [w ws] (incf w cat))))

这是我写的样本训练方法,我只是把一些训练数据转储到分类器中,这样我就不用每次手动训练它了。

代码语言:javascript
复制
(defn sampletrain
  []
    (do
       (train "Nobody owns the water." "good")
       (train "the quick rabit jumps fences" "good")
       (train "buy pharmaceuticals now" "bad")
       (train "make quick money at the online casino" "bad")
       (train "the quick brown fox jumps" "good")))

不幸的是,样本训练方法只训练我的分类器的最后一个项目或句子“快褐狐跳”被归类为“好”。最后,我的分类器看起来如下:{“{{”好“1},”快速“{”“goood”1},“褐色”{“好”1},“狐狸”{“好”1},“跳”{“好”1}}。如你所见,它只接受过最后一项的训练。为了避免这种情况,我用"do“语句包装了所有东西,但我不知道为什么只执行最后一次调用"train”方法。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-10-31 21:11:24

Clojure使用隐式返回,do语句也使用隐式返回,因此对每个句子都调用了train,但您只返回最后一个表达式的值。您可以将其包装在一个结构中,以返回所有它们。

将结果封装在向量中:

代码语言:javascript
复制
(defn sampletrain
  []
  [(train "Nobody owns the water." "good")
   (train "the quick rabit jumps fences" "good")
   (train "buy pharmaceuticals now" "bad")
   (train "make quick money at the online casino" "bad")
   (train "the quick brown fox jumps" "good")])
票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/53090918

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档