首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >测试集上只包含一个类的测试二进制分类器

测试集上只包含一个类的测试二进制分类器
EN

Data Science用户
提问于 2020-09-01 15:45:24
回答 3查看 226关注 0票数 1

我在研究一个疾病二元分类问题。

0=健康,1=不健康

这种疾病是一种运动障碍,它出现在病人移动特定运动的时候。我申请了休假一次交叉验证来训练所有的病人,除了一名要测试等等。

问题是,一些病人在他们的数据集中根本不健康。因此,评估指标F1评分,精确和召回急剧下降,因为这些病人。

我尝试使用过采样,但它没有工作,因为它将产生新的样本,从其他病人的数据。此外,我尝试了类权重,但它也没有起作用,因为在测试集中没有一个小类来赋予它更高的优先级。

我该如何解决这个问题?

EN

回答 3

Data Science用户

发布于 2021-03-29 12:11:26

您可以尝试汇集:“池”,将来自每一轮测试的所有预测集合在一起,并在这些集合预测之上计算一次度量。

基本上,您可以为每个测试集保留一个预测和真值的列表。然后,在对每个病人进行测试后,将所有的预测和真值组合在一起,并在最后生成一个包含所有患者的合并预测和真值的混淆矩阵。

然后你就能计算出精确性、召回性和精确性

票数 1
EN

Data Science用户

发布于 2020-09-01 21:40:46

给交叉验证或引导一个尝试!此外,对于度量标准,请查看每个类的性能和宏的平均值。

票数 0
EN

Data Science用户

发布于 2021-09-18 08:21:40

试着用分层法来看问题是否解决了。分割时,将分层参数添加为train_test_split(x, y, test_size = 0.2, random_state = 69, startify = y)

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/81090

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档