文章/答案/技术大牛

发布

问CNN模型的损失不收敛
EN

Stack Overflow用户

提问于 2020-04-25 22:07:18

回答 1查看 137关注 0票数 0

图像转换和批处理

transform = transforms.Compose([

                                transforms.Resize((100,100)),

                                transforms.ToTensor(),

                                transforms.Normalize([0.485,0.456,0.406],[0.229,0.224,0.225])

                                ])

data_set = datasets.ImageFolder(root="/content/drive/My Drive/models/pokemon/dataset",transform=transform)

train_loader = DataLoader(data_set,batch_size=10,shuffle=True,num_workers=6)

下面是我的模型

class pokimonClassifier(nn.Module):

  def __init__(self):

    super().__init__()

    self.conv1 = nn.Conv2d(3,6,3,1)

    self.conv2 = nn.Conv2d(6,18,3,1)

    self.fc1 = nn.Linear(23*23*18,520)

    self.fc2 = nn.Linear(520,400)

    self.fc3 = nn.Linear(400,320)

    self.fc4 = nn.Linear(320,149)

  def forward(self,x):

    x = F.relu(self.conv1(x))

    x = F.max_pool2d(x,2,2)

    x = F.relu(self.conv2(x))  

    x = F.max_pool2d(x,2,2)

    x = x.view(-1,23*23*18)

    x = F.relu(self.fc1(x))

    x = F.relu(self.fc2(x))

    x = F.relu(self.fc3(x))

    x = F.log_softmax(self.fc4(x), dim=1)

    return x

创建模型的实例，使用图形处理器，设置标准和优化器这里是先设置lr = 0.001，然后更改为0.0001

model = pokimonClassifier()
model.to('cuda')
criterion = nn.CrossEntropyLoss()

optimizer = torch.optim.Adam(model.parameters(),lr = 0.0001)

训练数据集

for e in range(epochs):

  train_crt = 0

  for b,(train_x,train_y) in enumerate(train_loader):

    b+=1

    train_x, train_y = train_x.to('cuda'), train_y.to('cuda')

    # train model

    y_preds = model(train_x)

    loss = criterion(y_preds,train_y)

    # analysis model

    predicted = torch.max(y_preds,1)[1]

    correct = (predicted == train_y).sum()

    train_crt += correct

    # print loss and accuracy

    if b%50 == 0:

        print(f'Epoch {e} batch{b} loss:{loss.item()} ')

    # updating weights and bais

    optimizer.zero_grad()

    loss.backward()

    optimizer.step()

  train_loss.append(loss)

  train_correct.append(train_crt)

我的损失值保持在4-3之间，并且不会收敛到0。我是深度学习的新手，我对它知之甚少。

我使用的数据集是：https://www.kaggle.com/thedagger/pokemon-generation-one

如果能帮上忙，我们将不胜感激。谢谢

computer-vision

pytorch

conv-neural-network

machine-learning

deep-learning

回答 1

Stack Overflow用户

发布于 2020-04-25 22:43:41

您的网络的问题在于您应用了两次softmax() -一次是在fc4()层，另一次是在使用nn.CrossEntropyLoss()时。

根据official documentation的说法，Pytorch在应用nn.CrossEntropyLoss()的同时会处理softmax()。

因此，在您的代码中，请更改此行

x = F.log_softmax(self.fc4(x), dim=1)

至

x = self.fc4(x)

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/61426911

复制

相似问题

问CNN模型的损失不收敛
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问CNN模型的损失不收敛EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问CNN模型的损失不收敛
EN