62 documentos marcados com "Intermediate"

Requires basic AI/ML understanding

Ver todas as etiquetas

Agent memory

How AI agents store, retrieve, and reason over information across turns and sessions.

Agent prompt engineering

Best practices for writing system prompts that produce reliable, well-scoped AI agent behavior.

AI and robotics

AI for perception, planning, and control in robotics.

AI safety

Ensuring AI systems are robust, aligned, and safe.

Anthropic Tool Use

Claude's native function/tool calling mechanism using JSON schema definitions, tool_use and tool_result message types, with support for multi-turn tool use, parallel calls, and streaming.

Autoavaliação e calibração

Como LLMs podem avaliar suas próprias saídas, expressar incerteza calibrada e usar crítica para melhorar a qualidade das respostas.

Autoconsistência

Como a autoconsistência melhora o raciocínio de LLMs gerando múltiplas cadeias de pensamento e selecionando a resposta mais consistente.

AutoGen

Microsoft's multi-agent conversation framework enabling LLM-powered agents to collaborate via structured message exchanges, with built-in code execution and human-in-the-loop support.

BERT

Representações de encoder bidirecional a partir de Transformers.

Case study — BART

Predecessor codificador-decodificador do Gemini; pré-treinamento com remoção de ruído para resumo e geração.

Case study — DeepSeek

LLMs de pesos abertos da DeepSeek AI com raciocínio e código robustos; MoE e escalabilidade eficiente.

Case study — Qwen

Família de LLMs da Alibaba; suporte multilíngue, de programação e de contexto longo.

Chain-of-thought (CoT)

Step-by-step reasoning to improve LLM outputs.

CI/CD for ML

Continuous integration and delivery adapted for machine learning — testing data, models, and code together.

Cohere

Enterprise-focused AI platform specializing in embeddings, reranking, and RAG for search and information retrieval at scale.

Conversational memory

Memory patterns for chat agents — buffer, summary, vector, and entity memory.

Data pipelines

An overview of data pipelines in the ML context — batch vs streaming, ETL vs ELT, data quality, and schema validation.

Data Version Control (DVC)

Git for data and models — versioning datasets, pipelines, and experiments alongside source code.

DeepSeek

Chinese AI lab offering open-weights models with state-of-the-art reasoning and coding capabilities at significantly lower cost than proprietary alternatives.

Engenharia Automática de Prompts (APE)

Como a Engenharia Automática de Prompts usa LLMs para gerar, avaliar e selecionar instruções de prompts otimizadas sem ajuste manual.

Engenharia de prompts

Elaboração de prompts para direcionar o comportamento de LLMs e melhorar as saídas.

Ensembling de prompts

Como o ensembling de prompts agrega múltiplas respostas de LLM para melhorar a precisão, reduzir a variância e produzir saídas mais confiáveis.

Experiment tracking

How to systematically log, compare, and reproduce ML experiments using tracking tools.

Fine-tuning

Adaptação de modelos pré-treinados para tarefas ou domínios específicos.

Gerenciamento de contexto

Como o Claude Code gerencia a janela de contexto em sessões longas — compressão automática, estratégias de histórico de conversas e técnicas práticas para manter as sessões eficazes em escala.

GPT

Transformer generativo pré-treinado e modelos somente-decoder.

Hugging Face

Plataforma e bibliotecas para modelos, conjuntos de dados e pipelines.

LangChain

Framework for LLM applications and agents.

Stateful agent graphs built on LangChain, where nodes are Python functions, edges define routing, and a shared TypedDict state enables cycles, conditional branching, persistence, and human-in-the-loop checkpoints.

LlamaIndex

Framework de dados para aplicações LLM e RAG.

Meta Llama

Família de modelos Llama de pesos abertos da Meta — implantação local, hospedagem via API de terceiros, fine-tuning e o debate entre modelos abertos e fechados.

Mistral AI

Plataforma dual de pesos abertos e API comercial da Mistral AI — modelos eficientes, pontos fortes multilíngues e La Plateforme para uso empresarial.

MLflow

Open-source platform for the complete ML lifecycle, covering experiment tracking, projects, models, and the registry.

Model Context Protocol (MCP)

Um padrão aberto para conectar modelos de IA a ferramentas externas, fontes de dados e serviços — habilitando uso de ferramentas portável e interoperável em qualquer aplicação de IA.

Model registry

Centralized store for versioning, staging, and governing ML model artifacts across their full lifecycle.

Modos de raciocínio e esforço

Extended thinking no Claude Code — o que é, como os níveis de esforço afetam a profundidade do raciocínio versus velocidade, e como configurar o comportamento de raciocínio para diferentes tipos de tarefas.

Monitoramento de ML

Guia abrangente para monitorar modelos de aprendizado de máquina em produção, cobrindo concept drift, data drift, degradação de modelos, métricas, estratégias de alertas e ferramentas.

Multi-agent systems

Multiple agents collaborating or competing.

ONNX Runtime

Motor de inferência de alto desempenho e multiplataforma para modelos ONNX com suporte a provedores de execução em CPU, GPU e NPU.

Planner-Executor architecture

Architecture where one LLM creates a step-by-step plan and another executes each step independently.

PyTorch

Framework de deep learning com grafos de computação dinâmicos.

PyTorch Mobile

Implante modelos PyTorch em dispositivos móveis e de borda usando TorchScript e o runtime de próxima geração ExecuTorch.

Raciocínio de borda

Executar inferência de modelos de linguagem diretamente em dispositivos edge para privacidade, latência e uso offline.

RAG architecture

Components and design choices in RAG systems.

RAG examples

Example RAG pipelines and code snippets.

ReAct (Reasoning + Acting)

Intercalação de raciocínio e ação em agentes.

Reasoning patterns

How LLMs and agents structure reasoning and action.

Redes Neurais Convolucionais (CNN)

CNNs para dados espaciais e de imagens.

Redes Neurais Recorrentes (RNN)

RNNs e dados sequenciais.

Retrieval-augmented generation (RAG)

Combining retrieval with LLM generation for accurate, grounded answers.

Retrieval-decision-design (RDD)

Spec-driven reasoning pattern combining retrieval and decision design.

Saídas estruturadas

Como guiar LLMs para produzir saídas em formatos estruturados como JSON, XML, Markdown e código, garantindo confiabilidade para sistemas downstream.

Serviço de modelos

Estratégias e frameworks para implantar modelos de ML como serviços de inferência escaláveis — lote, tempo real e streaming.

Skills do Claude Code

Templates de prompt reutilizáveis e invocáveis que estendem as capacidades do Claude Code — o que são skills, como escrevê-las, onde armazená-las e como invocá-las com /nome-da-skill.

Step-back prompting

Como o step-back prompting melhora o raciocínio de LLMs solicitando primeiro perguntas de alto nível antes de responder às perguntas específicas.

Streaming (LLMs)

Streaming de tokens em tempo real de LLMs.

Técnicas de desviesamento

Como identificar e mitigar vieses sistemáticos nas saídas de LLMs através de estratégias de prompting, amostragem e ensemble.

TensorFlow

Framework de deep learning do Google.

TensorFlow Lite

Runtime leve para inferência de ML no dispositivo em Android, iOS, sistemas embarcados e microcontroladores.

Tree of thoughts (ToT)

Exploração de múltiplos ramos de raciocínio.

Vector databases

Storing and searching embeddings for RAG.

Weights & Biases (W&B)

Cloud-native MLOps platform for experiment tracking, hyperparameter sweeps, artifact management, and collaborative reporting.