深度学习
定义
深度学习使用多层神经网络从数据中学习层次化表示。通过扩展数据和计算,它推动了视觉、语言和其他领域的进步。
它扩展了机器学习,使用可微分的分层模型(参见神经网络),自动学习特征而非手工设计。深度使模型能够构建越来越抽象的表示(例如在视觉中:边缘 → 纹理 → 部件 → 物体)。
工作原理
数据被送入第一层;每层应用线性变换后接非线性激活(如 ReLU)。堆叠层产生表示(嵌入),在更深的层中变得更抽象。最后一层映射到输出(如类别分数或 token)。训练使用反向传播计算梯度和梯度下降更新权重。架构(CNN 用于图像、RNN 用于序列、Transformer 用于两者)根据数据和任务调整连接方式和操作。
应用场景
当数据丰富且任务复杂时,深度学习是感知和生成的默认选择。
- 图像识别、目标检测和分割(视觉)
- 语音识别、机器翻译和文本生成(语言)
- 游戏、机器人控制和仿真(强化学习)
外部文档
- Deep Learning(Goodfellow 等人) — 免费在线书籍
- PyTorch – 入门 — 实践深度学习