腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(9999+)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
1
回答
贝叶斯网络可以在没有
垃圾
邮件训练集的情况下检测
垃圾
邮件吗
嗨,我有一个关于我正在尝试开发的
系统
的概念性问题,该
系统
试图对电子邮件进行
分类
。我有大量(>100k)非
垃圾
邮件和大量未
分类
邮件。那么,有没有可能使用一种方法(也许是贝叶斯)来检测
垃圾
邮件,而不需要
垃圾
邮件的数据集?我真的需要对
垃圾
邮件进行
分类
吗?
浏览 0
提问于2013-05-29
得票数 1
回答已采纳
2
回答
如何以编程方式挖掘tweeter sql转储。
我想在这个
垃圾
堆上造个
分类
器。我想知道是否有可用的包可以使用,以及我应该使用什么类型的
分类
器。我想用
java
构建这个
分类
器。
浏览 0
提问于2011-11-05
得票数 0
1
回答
在类别和多个子类别之间进行选择
我想要建立
分类
,提供这样的功能。我有一些大的
分类
,比如
垃圾
回收设备,下面是子
分类
,比如直升机,然后我又有了子
分类
。 我想建立
分类
系统
,当我创建新产品时,可以选择这样的
分类
路线。
浏览 12
提问于2013-02-20
得票数 0
回答已采纳
3
回答
如何在
垃圾
邮件-非
垃圾
邮件
分类
器中获得突出的单词?
假设我有一个
垃圾
邮件-非
垃圾
邮件
分类
器。如果一封新的电子邮件已经被
分类
为
垃圾
邮件,如何确定邮件中的单词主要负责
分类
器将其
分类
为
垃圾
邮件。将邮件归类为
垃圾
邮件的主要单词是“免费10000美元”。
浏览 0
提问于2016-07-06
得票数 0
1
回答
java
中使用朴素贝叶斯(weka)的简单文本
分类
我尝试在我的
java
代码中做文本
分类
朴素的bayes libarary,但是我认为
分类
的结果是不正确的,我不知道有什么问题。我使用arff文件作为输入。train.attribute(0).value((int)index); }结果表明,应该将
垃圾
邮件
分类
为类
垃圾
邮件的数据被
分类
为类
垃圾
邮件,而本应被
分类
为类
垃
浏览 1
提问于2017-01-30
得票数 6
1
回答
从
Java
中进行SURBL查找的简单方法?
我正在阅读有关 (已知
垃圾
邮件主机)的信息,目的是将
垃圾
邮件
分类
为批处理过程。主要的访问方法似乎是通过DNS查找。我想知道从
Java
代码中执行此类查找的通常方法是什么。
浏览 0
提问于2010-03-12
得票数 1
回答已采纳
1
回答
我的朴素贝叶斯训练数据需要成比例吗?
我将以
垃圾
邮件
分类
为例。典型的方法是手工
分类
随机抽样的电子邮件,并使用它们来训练NB
分类
器。 这些功能变得过于非
垃圾
邮件沉重。该算法在
分类
中隐式使用概率(
垃圾
邮件)(就像概率(医疗条件)被罕见的医疗条件降低一样,即使
浏览 0
提问于2015-10-28
得票数 1
回答已采纳
2
回答
有谁知道在
java
或c#中有一个很好的开源
垃圾
邮件检查器?
我想要自动检查新文章或评论是否为
垃圾
邮件。我正在寻找一些可以开箱即用的东西。更新:也许如果这样的东西不存在,有没有人知道下载了大量
垃圾
邮件和非
垃圾
邮件的
分类
,可以输入贝叶斯
分类
器?
浏览 2
修改于2010-03-31
得票数 0
回答已采纳
3
回答
Java
如何表示非常小的小数?
我开发了一个应用程序来检测
垃圾
邮件,使用朴素贝叶斯
分类
器。变量被声明为浮点数。
Java
如何处理6.9e-232这样的非常小的数字?
浏览 2
修改于2016-03-20
得票数 0
回答已采纳
1
回答
如何找到影响
分类
的有影响的词?
所以我知道有很多方法可以把句子
分类
。就像情感分析(积极,消极,中立),
垃圾
邮件(
垃圾
邮件,而不是
垃圾
邮件)等等。我想问的是,我如何找到对
分类
最负责的词。那么,我如何找到影响
分类
的单词呢?
浏览 0
修改于2018-07-04
得票数 1
1
回答
垃圾
邮件
分类
-机器学习
我必须使用一些
分类
器(例如朴素贝叶斯、支持向量机和另一个
分类
器)来做
垃圾
邮件检测应用,并比较它们的效率,但不幸的是,我不知道我应该做什么。这是正确的吗:首先,我应该有trec2005,
垃圾
邮件或安然
垃圾
邮件等
垃圾
邮件.然后,我做文字预处理,如词干,停止字删除,标记等.在此之后,我可以使用tf-以色列国防军在
垃圾
邮件中衡量我的特征/术语的权重。接下来,我用非常低的频率和很高的频率去除这些特征。然后我就可以把我的邮件
分类
了。对吗?之后,我可以用真
浏览 1
修改于2014-03-15
得票数 1
回答已采纳
2
回答
基于机器学习的
垃圾
邮件检测
大多数在线教程喜欢使用一个简单的示例来介绍机器学习,方法是对
垃圾
邮件中的未知文本进行
分类
或不对
垃圾
邮件进行
分类
。他们说这是二进位问题。但是为什么这是一个二元类的问题呢?我认为这是一个单级问题!我只需要我的收件箱积极样本,以了解什么不是
垃圾
邮件。如果我确实把一堆非
垃圾
短信作为阳性样本,一堆
垃圾
邮件作为否定样本,那么当然可以训练二进制
分类
器并根据未标记的数据进行预测,但是与onc类方法有什么区别呢?在那里,我只需要定义一个训练集的所有非
垃圾</em
浏览 0
提问于2014-10-29
得票数 4
回答已采纳
1
回答
电子邮件
分类
器根据时间对电子邮件进行
分类
我必须设计一个程序,可以将电子邮件
分类
为
垃圾
邮件或非
垃圾
邮件使用Python和Pandas。 我已经做了
分类
,电子邮件作为
垃圾
邮件或非
垃圾
邮件,根据电子邮件的主题。对于我的第二项任务,我必须根据时间将电子邮件
分类
为
垃圾
邮件或非
垃圾
邮件。如果这封邮件是在(星期五和星期六)收到的,它应该被归类为
垃圾
邮件。否则不是
垃圾
邮件。我真的不知道该怎么做。
浏览 6
修改于2022-07-27
得票数 0
回答已采纳
1
回答
sci学习朴素贝叶斯
分类
器的损失/风险函数
我想知道是否有可能在scikit-learn中为朴素的Bayes
分类
器定义损失函数。例如,让我们假设我们对
垃圾
邮件和火腿
分类
感兴趣。在这种情况下,这样的损失函数将有助于降低假阳性率(即将火腿归类为
垃圾
邮件,这比将
垃圾
邮件
分类
为火腿“更糟”)。 为了简单起见,我有一个使用来自高斯的随机数据的例子。
浏览 0
提问于2014-08-30
得票数 2
回答已采纳
1
回答
制作有标签的培训数据集
我们正在开发一个
分类
系统
,其中
分类
是固定的,但其中许多是相互关联的.通过手动注释文本,我们将为这个
分类
器构建一个训练集。那么,我们能为一个问题加上多个标签吗?例如,“人行道附近有一个
垃圾
堆,人行道完全坏了”。本文可以分为garbage桶或footpath桶。那么,这篇文章是否应该作为ga
浏览 0
修改于2015-06-04
得票数 3
回答已采纳
3
回答
如何获得
垃圾
邮件的概率而不是
分类
我正在构建一个工具来计算一个文本评论的概率是假的(
垃圾
邮件)还是真实的。 我有一个带注释的评论数据集,标记为
垃圾
邮件或非
垃圾
邮件。我已经使用svm构建了一个
分类
器,但这只能将输入文档
分类
为
垃圾
文档或非
垃圾
文档。然而,我想要一个工具,它会给我一个介于0和1之间的数字,代表该文档是
垃圾
邮件的概率。有人能给我指个方向吗?
浏览 0
提问于2012-11-26
得票数 0
回答已采纳
7
回答
如何在一行中计算特定单词的频率?
我想知道,如果我有一个单行字符串,那么如何使用简单的
java
代码计算该字符串中特定单词的频率?! 我要找的是
java
中的一个示例逻辑代码,它用于搜索句子中的特定单词。我正在构建一个
垃圾
邮件过滤器,它需要读取行,然后
分类
。
浏览 4
修改于2011-08-09
得票数 4
5
回答
引导
Java
执行冗长的
垃圾
收集
我想向我的学生演示,在实时
系统
中使用
Java
可能会有问题,因为
Java
可能会进行意外的
垃圾
收集。如何编写
Java
程序,以便: 注意:我不是在寻找
垃圾
收集过程的图形表示--只
浏览 0
提问于2018-01-29
得票数 1
1
回答
多个朴素贝叶斯
分类
器
我正在为一个审查站点实现一个朴素的Byes
分类
器,以便识别
垃圾
评论,并有几个问题。 在我看来,有多种类型的
垃圾
邮件,例如直接营销
垃圾
与他们正在审查的事情无关,而不是一个欺骗性的评论。为了不同的目的实现多个
分类
器是明智的,这样一个能更好地检测
垃圾
邮件,而另一个则学习欺骗性的评论吗?同样地,有多个类别的项目正在被审查,所以对于“欺骗性审查”
分类
器来说,是否最好只有一个
分类
器尝试从所有的评论中学习?还是每个类别都有一个
分类
器,以便能够学
浏览 8
提问于2017-04-18
得票数 0
2
回答
如何更改NaiveBayesMultinomial中的
分类
阈值或在Weka中手动计算混淆矩阵
我正在做一个
垃圾
邮件过滤挖掘项目,我目前正在使用NaiveBayesMultinomial
分类
器,通过计数出现的单词频率,将
垃圾
邮件从非
垃圾
邮件中
分类
。问题是,默认情况下,WEKA将
分类
阈值设置为0.5。然而,将非
垃圾
邮件错误
分类
为
垃圾
邮件比
垃圾
邮件更有害。
浏览 6
修改于2021-09-07
得票数 1
回答已采纳
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
点击加载更多
领券