首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >分割小数据的最好方法是什么?

分割小数据的最好方法是什么?
EN

Data Science用户
提问于 2022-11-12 13:58:23
回答 1查看 52关注 0票数 1

我有17-20个视频(5分钟)的数据集,每个视频代表一个不同的类(大约4个类)。我无法获得更多的视频,因为这是公司提供的。我是planingI,正在计划分割视频路径,然后应用视频捕获作为每个视频的图像,然后应用CNN进行分类。

我知道我的数据很小(这可能会导致过度装修),如果我不能增加视频的数量,我该如何处理呢?

代码语言:javascript
复制
 train_data, extra_data = train_test_split(video_path, train_size=0.9, shuffle=False) #90

validation_data, test_data = train_test_split(extra_data, test_size=0.2, shuffle=False #10
EN

回答 1

Data Science用户

发布于 2022-11-13 22:57:27

您有有限的视频,您将转换为图像,以进一步培训模型。总有你可以做的数据增强,但要再次记住,它不应该太多。

为了避免过度拟合,在你做了数据增强之后,看看训练损失和泛化损失。如果这两者之间的差距太大,你将面临过度拟合。如果训练损失的价值太大,你会在适当的情况下面对。

数据的稀缺性一直是一个瓶颈,因为大多数模型都无法投入生产。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/116116

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档