我目前正在处理一个相当大的图像数据集,我使用python中的ImageDataGenerator从tensorflow.keras加载它。由于我的数据分类非常不平衡,我想做一个分层的列车测试分割,以可能达到更高的精度。
我知道如何使用ImageDataGenerator进行简单的随机列车测试分割,但我找不到与sklearn中的分层train_test_split相当的东西。
有什么方法可以对tensorflow.data.Dataset进行分层的列车测试吗?如果没有,如何处理大型不平衡数据集?我非常感谢你的帮助!
以下是相关代码:
from tensorflow.keras.preprocessing.image import ImageDataGenerator
datagen = ImageDataGenerator()
dataset = datagen.flow_from_directory(
path_images,
target_size=(ImageHeight, ImageWidth),
color_mode='rgb',
class_mode='sparse',
batch_size=BatchSize,
shuffle=True,
seed=Seed,
)发布于 2022-06-25 01:56:43
流( x,y=None,batch_size=32,shuffle=True,sample_weight=None,seed=None,save_to_dir=None,save_前缀=‘’,save_format='png',ignore_class_split=False,subset=None )
https://stackoverflow.com/questions/71381621
复制相似问题