卷积神经网络（CNN）

定义

CNN 使用卷积层来捕获局部模式（边缘、纹理）并构建层次化特征。它们是图像分类、检测和分割的标准骨干网络。

与密集神经网络不同，卷积在空间上共享权重，因此对于图像和其他网格状数据具有平移等变性和高效性。它们构成了大多数计算机视觉系统的骨干，也用于 Transformer 中的 patch 嵌入。

工作原理

图像（或特征图）被送入卷积层：每个滤波器在输入上滑动并计算点积，产生突出局部模式（边缘、纹理）的激活图。池化（如最大池化）在空间上下采样，减小尺寸并添加轻微的不变性。更深的卷积层看到更大的感受野，捕获更抽象的特征（部件、物体）。最终的分类（或检测/分割）头通常是在展平或池化特征之上的一个或多个密集层。训练使用与其他深度学习模型相同的反向传播和梯度下降。

应用场景

CNN 是任何空间结构（图像、视频或 2D/3D 信号）重要的任务的标准选择。

图像分类（如物体识别、医学图像分析）
目标检测和实例分割
视频分析和动作识别

卷积神经网络（CNN）

定义

工作原理

应用场景

外部文档

另请参阅

定义​

工作原理​

应用场景​

外部文档​

另请参阅​

定义

工作原理

应用场景

外部文档

另请参阅