我有17-20个视频(5分钟)的数据集,每个视频代表一个不同的类(大约4个类)。我无法获得更多的视频,因为这是公司提供的。我是planingI,正在计划分割视频路径,然后应用视频捕获作为每个视频的图像,然后应用CNN进行分类。
我知道我的数据很小(这可能会导致过度装修),如果我不能增加视频的数量,我该如何处理呢?
train_data, extra_data = train_test_split(video_path, train_size=0.9, shuffle=False) #90
validation_data, test_data = train_test_split(extra_data, test_size=0.2, shuffle=False #10发布于 2022-11-13 22:57:27
您有有限的视频,您将转换为图像,以进一步培训模型。总有你可以做的数据增强,但要再次记住,它不应该太多。
为了避免过度拟合,在你做了数据增强之后,看看训练损失和泛化损失。如果这两者之间的差距太大,你将面临过度拟合。如果训练损失的价值太大,你会在适当的情况下面对。
数据的稀缺性一直是一个瓶颈,因为大多数模型都无法投入生产。
https://datascience.stackexchange.com/questions/116116
复制相似问题