首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >SMOTE技术不过度采样图像数据集

SMOTE技术不过度采样图像数据集
EN

Stack Overflow用户
提问于 2021-07-12 17:07:12
回答 1查看 429关注 0票数 1

我对图书馆不熟悉。我有图像数据集属于5类,数据集非常不平衡。

我使用tensorflow flow.from目录函数加载图像,并使用smote函数进行重采样。

代码语言:javascript
复制
img_height, img_width = 224,224
# the no. imgaes to load at each iteration
batch_size = 32
# only rescaling
train_datagen =  ImageDataGenerator(
    rescale=1./255,
    zoom_range=0.2,
    horizontal_flip=True,
    vertical_flip=True
)
test_datagen =  ImageDataGenerator(
    rescale=1./255,
    vertical_flip=True, 
    zoom_range=0.2,
    horizontal_flip=True
)
# these are generators for train/test data that will read pictures #found in the defined subfolders of 'data/'
print('Total number of images for "training":')
train_generator = train_datagen.flow_from_directory(
train_data_dir,
target_size = (img_height, img_width),
batch_size = batch_size, 
class_mode = "categorical",shuffle = True
    #,color_mode='grayscale'
)    
smote = SMOTE()
    X_sm, y_sm = smote.fit_resample(train_generator, category_names)

细胞开始运行,30到40分钟后,jupyter内核就死了,我没有得到任何结果。请帮助解决这个问题,我有16 GB的GPU,但是smote没有在图像数据集上运行。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-07-12 17:41:56

  1. 您可以对不平衡类别执行数据增强
  2. 将它们调整为(28,28)或(32,32),并使用压扁将其转换为784或1024功能,现在可以使用SMOTE

希望它能成功

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/68351376

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档