卷积神经网络 (Convolutional Neural Network, CNN) 是一种专为处理网格状拓扑数据(如图像、视频、语音频谱图)而设计的深度学习模型。
CNN 的成功归功于两个颠覆传统全连接网络的设计哲学:
一个典型的 CNN 由以下三种层交替堆叠而成:
数学表达:


Conv -> ReLU -> Pool 重复多次 -> Flatten -> FC -> Output。这是 CNN 训练中最常见的问题,解决方案组合拳:
CNN 的应用早已超越了简单的图片分类,渗透到各个领域:

虽然 Transformer 在视觉领域(ViT)崛起,但 CNN 并未消亡,而是在进化:
总结:CNN 是深度学习皇冠上的明珠之一。理解 CNN 不仅是掌握图像处理的钥匙,更是理解“局部特征组合成全局语义”这一智能本质的关键一步。