问分割小数据的最好方法是什么？
EN

Data Science用户

提问于 2022-11-12 13:58:23

回答 1查看 52关注 0票数 1

我有17-20个视频(5分钟)的数据集，每个视频代表一个不同的类(大约4个类)。我无法获得更多的视频，因为这是公司提供的。我是planingI，正在计划分割视频路径，然后应用视频捕获作为每个视频的图像，然后应用CNN进行分类。

我知道我的数据很小(这可能会导致过度装修)，如果我不能增加视频的数量，我该如何处理呢？

 train_data, extra_data = train_test_split(video_path, train_size=0.9, shuffle=False) #90

validation_data, test_data = train_test_split(extra_data, test_size=0.2, shuffle=False #10

deep-learning

classification

cnn

回答 1

Data Science用户

发布于 2022-11-13 22:57:27

您有有限的视频，您将转换为图像，以进一步培训模型。总有你可以做的数据增强，但要再次记住，它不应该太多。

为了避免过度拟合，在你做了数据增强之后，看看训练损失和泛化损失。如果这两者之间的差距太大，你将面临过度拟合。如果训练损失的价值太大，你会在适当的情况下面对。

数据的稀缺性一直是一个瓶颈，因为大多数模型都无法投入生产。

票数 1

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/116116

复制

相似问题

问分割小数据的最好方法是什么？
EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问分割小数据的最好方法是什么？EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问分割小数据的最好方法是什么？
EN