首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何使用WEKA计算垃圾短信的“特征向量”?

如何使用WEKA计算垃圾短信的“特征向量”?
EN

Stack Overflow用户
提问于 2015-12-18 15:17:27
回答 1查看 96关注 0票数 2

我想实现邮件过滤;在WEKA应用程序中通过机器学习将电子邮件分类为垃圾邮件或合法(文本分类)。

如何通过WEKA的应用来获取数据集的“特征向量”?这个向量应该包括100个出现频率最高、权重最高的垃圾邮件单词。

数据集:http://www.dt.fee.unicamp.br/~tiago/smsspamcollection/smsSpamCollection.arff

EN

回答 1

Stack Overflow用户

发布于 2015-12-18 22:57:53

我没有使用WEKA,但作为coursera提供的机器课程的一部分,我每年都使用Matlab做同样的事情。coursera由斯坦福大学的Andrew NG博士在第7周提供。要创建特征向量,您可以搜索电子邮件,查看每个单词是否存在。然后,特征向量将是0和1的向量,其中1表示存在相应的单词,而0表示不存在。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/34350287

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档