文章/答案/技术大牛

发布

社区首页 >问答首页 >如何使用非常小的训练、测试和验证数据集来度量模型的特异性的可靠性？

问如何使用非常小的训练、测试和验证数据集来度量模型的特异性的可靠性？
EN

Data Science用户

提问于 2019-03-04 22:30:23

回答 1查看 212关注 0票数 0

这里是新手。我有一个小的数据集646个样本，我已经训练了一个合理的性能模型(~99%的测试和瓦尔的准确性)。让事情变得更复杂一点的是，这些类有些不平衡。这是一个二元分类问题。

这是我对训练数据的混淆矩阵。

[[387   1]
 [  1  73]]

关于测试数据：

[[74  1]
 [ 0 10]]

关于验证数据：

[[85  1]
 [ 0 13]]

训练特异性：.986
检测特异性：.909
验证特异性：.928

我认为测试和验证的特异性很低，而训练的特异性相对较高。然而，考虑到在测试和验证数据集中只遗漏了一个样本，我的真实世界的特异性是什么？是否有更好的泛化措施？给定负样本类的大小，是否有类似于p值的东西来关联特定性的可靠性？

谢谢!

machine-learning

statistics

generalization

回答 1

Data Science用户

发布于 2019-03-04 23:11:10

真实世界的数据是“测试数据集”，对吗？数据必须以这样一种方式划分，即训练验证不止一次查看部分数据，而测试数据只能看到一次。从这个意义上说，如果模型足够健壮，那么即使在测试数据集中，它也会表现良好。假设测试数据尽可能接近真实世界的数据.

票数 0

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/46667

复制

相似问题

问如何使用非常小的训练、测试和验证数据集来度量模型的特异性的可靠性？
EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何使用非常小的训练、测试和验证数据集来度量模型的特异性的可靠性？EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何使用非常小的训练、测试和验证数据集来度量模型的特异性的可靠性？
EN