
卷积神经网络(CNN)主要由输入层、卷积层、激活函数、池化层和全连接层组成。典型结构为:
输出特征图尺寸的计算公式为: [ N = \frac{W - F + 2P}{S} + 1 ]
AlexNet包含5个卷积层和3个全连接层,使用PyTorch实现:
self.conv1 = torch.nn.Sequential(
torch.nn.Conv2d(3, 96, kernel_size=11, stride=4, padding=0),
torch.nn.ReLU(),
torch.nn.MaxPool2d(kernel_size=3, stride=2) # 输出27x27x96
)问题1:为何使用Conv2d?
问题2:卷积核参数简化
nn.Conv2d(3, 6, 5)中5表示5x5的方形卷积核。若需非方形核,需显式指定(如(5, 3))。