Redes neurais
Definição
Redes neurais são aproximadores de funções construídos a partir de camadas de unidades (neurônios) com pesos aprendíveis e ativações não lineares. Podem aproximar mapeamentos complexos de entradas para saídas quando treinadas com dados.
São os blocos de construção do aprendizado profundo. Variantes como CNNs e RNNs adicionam vieses indutivos (ex.: localidade, recorrência) para tipos de dados específicos; o mesmo mecanismo de treinamento (retropropagação, descida de gradiente) se aplica.
Como funciona
A entrada é passada para a primeira camada. Cada camada calcula uma combinação linear de suas entradas (pesos) e então uma ativação não linear (ex.: ReLU, sigmoide). A saída de uma camada se torna a entrada da próxima; empilhar camadas permite à rede aprender características hierárquicas. A camada de saída final mapeia tipicamente para predições (ex.: pontuações de classe ou um escalar). O treinamento minimiza uma perda por retropropagação (cálculo de gradientes pela regra da cadeia) e descida de gradiente (atualização de pesos). Profundidade e largura determinam a capacidade; regularização e tamanho dos dados controlam o overfitting.
Casos de uso
Redes neurais são usadas onde quer que se precise de aproximação de funções flexível e orientada por dados.
- Regressão e classificação (ex.: previsão de vendas, classificação de imagens)
- Aprendizado de características para tarefas posteriores (embeddings, transfer learning)
- Aproximação de funções não lineares complexas em controle ou simulação
Documentação externa
- Neural Networks and Deep Learning (Nielsen) — Livro online gratuito
- 3Blue1Brown – Redes neurais — Introdução visual