深度学习

定义

深度学习使用多层神经网络从数据中学习层次化表示。通过扩展数据和计算，它推动了视觉、语言和其他领域的进步。

它扩展了机器学习，使用可微分的分层模型（参见神经网络），自动学习特征而非手工设计。深度使模型能够构建越来越抽象的表示（例如在视觉中：边缘 → 纹理 → 部件 → 物体）。

工作原理

数据被送入第一层；每层应用线性变换后接非线性激活（如 ReLU）。堆叠层产生表示（嵌入），在更深的层中变得更抽象。最后一层映射到输出（如类别分数或 token）。训练使用反向传播计算梯度和梯度下降更新权重。架构（CNN 用于图像、RNN 用于序列、Transformer 用于两者）根据数据和任务调整连接方式和操作。

应用场景

当数据丰富且任务复杂时，深度学习是感知和生成的默认选择。

图像识别、目标检测和分割（视觉）
语音识别、机器翻译和文本生成（语言）
游戏、机器人控制和仿真（强化学习）

外部文档

Deep Learning（Goodfellow 等人） — 免费在线书籍
PyTorch – 入门 — 实践深度学习

定义​

工作原理​

应用场景​

外部文档​

另请参阅​

定义

工作原理

应用场景

外部文档

另请参阅