以下方法是EMail垃圾邮件检测项目中预测功能的实现。
预测给定行(邮件)的类
def predict(summaries, inputVector):
probabilities = calculateClassProbabilities(summaries, inputVector)
bestLabel, bestProb = None, -1
for classValue, probability in probabilities.items():
#print(classValue,'->',probability)
if bestLabel is None or probability > bestProb:
bestProb = probability
bestLabel = classValue
return bestLabel我无法理解如何使用上述功能将特定数据项分类为垃圾邮件或火腿
发布于 2020-02-15 13:37:08
calculateClassProbabilities函数执行所有真正的工作(可能对字典中的每个单词都有一个垃圾邮件或非垃圾邮件分数,并对电子邮件词汇表的分数求和)。该函数返回可能的类别列表(“垃圾邮件”、“合法邮件”、“大量电子邮件,但dpn实际上并不想读”)和相关的概率。这里的循环只是找到概率最高的类别并返回它。
https://stackoverflow.com/questions/60235738
复制相似问题