搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

1回答

贝叶斯网络可以在没有垃圾邮件训练集的情况下检测垃圾邮件吗

嗨，我有一个关于我正在尝试开发的系统的概念性问题，该系统试图对电子邮件进行分类。我有大量(>100k)非垃圾邮件和大量未分类邮件。那么，有没有可能使用一种方法(也许是贝叶斯)来检测垃圾邮件，而不需要垃圾邮件的数据集？我真的需要对垃圾邮件进行分类吗？

浏览 0提问于2013-05-29得票数 1

回答已采纳

2回答

如何以编程方式挖掘tweeter sql转储。

我想在这个垃圾堆上造个分类器。我想知道是否有可用的包可以使用，以及我应该使用什么类型的分类器。我想用java构建这个分类器。

浏览 0提问于2011-11-05得票数 0

1回答

在类别和多个子类别之间进行选择

我想要建立分类，提供这样的功能。我有一些大的分类，比如垃圾回收设备，下面是子分类，比如直升机，然后我又有了子分类。我想建立分类系统，当我创建新产品时，可以选择这样的分类路线。

浏览 12提问于2013-02-20得票数 0

回答已采纳

3回答

如何在垃圾邮件-非垃圾邮件分类器中获得突出的单词？

假设我有一个垃圾邮件-非垃圾邮件分类器。如果一封新的电子邮件已经被分类为垃圾邮件，如何确定邮件中的单词主要负责分类器将其分类为垃圾邮件。将邮件归类为垃圾邮件的主要单词是“免费10000美元”。

浏览 0提问于2016-07-06得票数 0

1回答

java中使用朴素贝叶斯(weka)的简单文本分类

我尝试在我的java代码中做文本分类朴素的bayes libarary，但是我认为分类的结果是不正确的，我不知道有什么问题。我使用arff文件作为输入。train.attribute(0).value((int)index); }结果表明，应该将垃圾邮件分类为类垃圾邮件的数据被分类为类垃圾邮件，而本应被分类为类垃

浏览 1提问于2017-01-30得票数 6

1回答

从Java中进行SURBL查找的简单方法？

我正在阅读有关 (已知垃圾邮件主机)的信息，目的是将垃圾邮件分类为批处理过程。主要的访问方法似乎是通过DNS查找。我想知道从Java代码中执行此类查找的通常方法是什么。

浏览 0提问于2010-03-12得票数 1

回答已采纳

1回答

我的朴素贝叶斯训练数据需要成比例吗？

我将以垃圾邮件分类为例。典型的方法是手工分类随机抽样的电子邮件，并使用它们来训练NB分类器。这些功能变得过于非垃圾邮件沉重。该算法在分类中隐式使用概率(垃圾邮件)(就像概率(医疗条件)被罕见的医疗条件降低一样，即使

浏览 0提问于2015-10-28得票数 1

回答已采纳

2回答

有谁知道在java或c#中有一个很好的开源垃圾邮件检查器？

我想要自动检查新文章或评论是否为垃圾邮件。我正在寻找一些可以开箱即用的东西。更新:也许如果这样的东西不存在，有没有人知道下载了大量垃圾邮件和非垃圾邮件的分类，可以输入贝叶斯分类器？

浏览 2修改于2010-03-31得票数 0

回答已采纳

3回答

Java如何表示非常小的小数？

我开发了一个应用程序来检测垃圾邮件，使用朴素贝叶斯分类器。变量被声明为浮点数。Java如何处理6.9e-232这样的非常小的数字？

浏览 2修改于2016-03-20得票数 0

回答已采纳

1回答

如何找到影响分类的有影响的词？

所以我知道有很多方法可以把句子分类。就像情感分析(积极，消极，中立)，垃圾邮件(垃圾邮件，而不是垃圾邮件)等等。我想问的是，我如何找到对分类最负责的词。那么，我如何找到影响分类的单词呢？

浏览 0修改于2018-07-04得票数 1

1回答

我必须使用一些分类器(例如朴素贝叶斯、支持向量机和另一个分类器)来做垃圾邮件检测应用，并比较它们的效率，但不幸的是，我不知道我应该做什么。这是正确的吗:首先，我应该有trec2005，垃圾邮件或安然垃圾邮件等垃圾邮件.然后，我做文字预处理，如词干，停止字删除，标记等.在此之后，我可以使用tf-以色列国防军在垃圾邮件中衡量我的特征/术语的权重。接下来，我用非常低的频率和很高的频率去除这些特征。然后我就可以把我的邮件分类了。对吗？之后，我可以用真

浏览 1修改于2014-03-15得票数 1

回答已采纳

2回答

基于机器学习的垃圾邮件检测

大多数在线教程喜欢使用一个简单的示例来介绍机器学习，方法是对垃圾邮件中的未知文本进行分类或不对垃圾邮件进行分类。他们说这是二进位问题。但是为什么这是一个二元类的问题呢？我认为这是一个单级问题！我只需要我的收件箱积极样本，以了解什么不是垃圾邮件。如果我确实把一堆非垃圾短信作为阳性样本，一堆垃圾邮件作为否定样本，那么当然可以训练二进制分类器并根据未标记的数据进行预测，但是与onc类方法有什么区别呢？在那里，我只需要定义一个训练集的所有非垃圾</em

浏览 0提问于2014-10-29得票数 4

回答已采纳

1回答

电子邮件分类器根据时间对电子邮件进行分类

我必须设计一个程序，可以将电子邮件分类为垃圾邮件或非垃圾邮件使用Python和Pandas。我已经做了分类，电子邮件作为垃圾邮件或非垃圾邮件，根据电子邮件的主题。对于我的第二项任务，我必须根据时间将电子邮件分类为垃圾邮件或非垃圾邮件。如果这封邮件是在(星期五和星期六)收到的，它应该被归类为垃圾邮件。否则不是垃圾邮件。我真的不知道该怎么做。

浏览 6修改于2022-07-27得票数 0

回答已采纳

1回答

sci学习朴素贝叶斯分类器的损失/风险函数

我想知道是否有可能在scikit-learn中为朴素的Bayes分类器定义损失函数。例如，让我们假设我们对垃圾邮件和火腿分类感兴趣。在这种情况下，这样的损失函数将有助于降低假阳性率(即将火腿归类为垃圾邮件，这比将垃圾邮件分类为火腿“更糟”)。为了简单起见，我有一个使用来自高斯的随机数据的例子。

浏览 0提问于2014-08-30得票数 2

回答已采纳

1回答

制作有标签的培训数据集

我们正在开发一个分类系统，其中分类是固定的，但其中许多是相互关联的.通过手动注释文本，我们将为这个分类器构建一个训练集。那么，我们能为一个问题加上多个标签吗？例如，“人行道附近有一个垃圾堆，人行道完全坏了”。本文可以分为garbage桶或footpath桶。那么，这篇文章是否应该作为ga

浏览 0修改于2015-06-04得票数 3

回答已采纳

3回答

如何获得垃圾邮件的概率而不是分类

我正在构建一个工具来计算一个文本评论的概率是假的(垃圾邮件)还是真实的。我有一个带注释的评论数据集，标记为垃圾邮件或非垃圾邮件。我已经使用svm构建了一个分类器，但这只能将输入文档分类为垃圾文档或非垃圾文档。然而，我想要一个工具，它会给我一个介于0和1之间的数字，代表该文档是垃圾邮件的概率。有人能给我指个方向吗？

浏览 0提问于2012-11-26得票数 0

回答已采纳

7回答

如何在一行中计算特定单词的频率？

我想知道，如果我有一个单行字符串，那么如何使用简单的java代码计算该字符串中特定单词的频率？！我要找的是java中的一个示例逻辑代码，它用于搜索句子中的特定单词。我正在构建一个垃圾邮件过滤器，它需要读取行，然后分类。

浏览 4修改于2011-08-09得票数 4

5回答

引导Java执行冗长的垃圾收集

我想向我的学生演示，在实时系统中使用Java可能会有问题，因为Java可能会进行意外的垃圾收集。如何编写Java程序，以便：注意:我不是在寻找垃圾收集过程的图形表示--只

浏览 0提问于2018-01-29得票数 1

1回答

多个朴素贝叶斯分类器

我正在为一个审查站点实现一个朴素的Byes分类器，以便识别垃圾评论，并有几个问题。在我看来，有多种类型的垃圾邮件，例如直接营销垃圾与他们正在审查的事情无关，而不是一个欺骗性的评论。为了不同的目的实现多个分类器是明智的，这样一个能更好地检测垃圾邮件，而另一个则学习欺骗性的评论吗？同样地，有多个类别的项目正在被审查，所以对于“欺骗性审查”分类器来说，是否最好只有一个分类器尝试从所有的评论中学习？还是每个类别都有一个分类器，以便能够学

浏览 8提问于2017-04-18得票数 0

2回答

如何更改NaiveBayesMultinomial中的分类阈值或在Weka中手动计算混淆矩阵

我正在做一个垃圾邮件过滤挖掘项目，我目前正在使用NaiveBayesMultinomial分类器，通过计数出现的单词频率，将垃圾邮件从非垃圾邮件中分类。问题是，默认情况下，WEKA将分类阈值设置为0.5。然而，将非垃圾邮件错误分类为垃圾邮件比垃圾邮件更有害。

浏览 6修改于2021-09-07得票数 1

回答已采纳

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

贝叶斯网络可以在没有垃圾邮件训练集的情况下检测垃圾邮件吗

如何以编程方式挖掘tweeter sql转储。

在类别和多个子类别之间进行选择

如何在垃圾邮件-非垃圾邮件分类器中获得突出的单词？

java中使用朴素贝叶斯(weka)的简单文本分类

从Java中进行SURBL查找的简单方法？

我的朴素贝叶斯训练数据需要成比例吗？

有谁知道在java或c#中有一个很好的开源垃圾邮件检查器？

Java如何表示非常小的小数？

如何找到影响分类的有影响的词？

垃圾邮件分类-机器学习

基于机器学习的垃圾邮件检测

电子邮件分类器根据时间对电子邮件进行分类

sci学习朴素贝叶斯分类器的损失/风险函数

制作有标签的培训数据集

如何获得垃圾邮件的概率而不是分类

如何在一行中计算特定单词的频率？

引导Java执行冗长的垃圾收集

多个朴素贝叶斯分类器

如何更改NaiveBayesMultinomial中的分类阈值或在Weka中手动计算混淆矩阵

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐