我刚开始深入学习,我的第一个作业是完成一个基于卷积神经网络的树叶分类系统。我用github上的代码构建了一个resnet-34模型来做it.However,我的老师告诉我,他的数据集中的基本训练单元是图像对。我应该使用2幅图像(在不同光照条件下的同一片叶子的照片)作为输入,将两幅3通道图像合并成一幅6通道图像,但我不知道如何输入2幅图像并将它们组合成6 channels.How,我能这样做吗?有什么功能吗?我应该修改resnet网络的结构吗?

这是我的数据集,你可以看到每两张图片都是同一片叶子。
发布于 2022-04-13 05:32:19
你有几个问题要解决:
__getitem__方法的Dataset,而不是返回单个图像和标签的基本图像。您可能需要确保您应用于图像的增强以相同的方式应用于每一对图像。customize your own dataset.state_dict of ResNet34,因为更改了#3和#4 --您必须第一次手动完成。。
https://stackoverflow.com/questions/71852199
复制相似问题