Aprendizado profundo
Definição
O aprendizado profundo usa redes neurais com muitas camadas para aprender representações hierárquicas a partir de dados. Impulsionou avanços em visão, linguagem e outros domínios ao escalar dados e computação.
Ele estende o aprendizado de máquina usando modelos diferenciáveis e em camadas (veja redes neurais) que aprendem características automaticamente em vez de projetá-las manualmente. A profundidade permite que o modelo construa representações cada vez mais abstratas (ex.: bordas → texturas → partes → objetos em visão).
Como funciona
Os dados são alimentados na primeira camada; cada camada aplica uma transformação linear seguida de uma não linearidade (ex.: ReLU). Empilhar camadas produz uma representação (embedding) que se torna mais abstrata em camadas mais profundas. A camada final mapeia para a saída (ex.: pontuações de classe ou tokens). O treinamento usa retropropagação para calcular gradientes e descida de gradiente para atualizar pesos. Arquiteturas (CNNs para imagens, RNNs para sequências, Transformers para ambos) adaptam a conectividade e operações aos dados e à tarefa.
Casos de uso
O aprendizado profundo é o padrão para percepção e geração quando dados são abundantes e tarefas são complexas.
- Reconhecimento de imagens, detecção de objetos e segmentação (visão)
- Reconhecimento de fala, tradução automática e geração de texto (linguagem)
- Jogos, controle robótico e simulação (aprendizado por reforço)
Documentação externa
- Deep Learning (Goodfellow et al.) — Livro online gratuito
- PyTorch – Introdução — Aprendizado profundo prático