73 documents tagués avec "Intermediate"

Requires basic AI/ML understanding

Voir tous les tags

Agent memory

How AI agents store, retrieve, and reason over information across turns and sessions.

Agent prompt engineering

Best practices for writing system prompts that produce reliable, well-scoped AI agent behavior.

Agents autonomes

Agents qui opèrent avec un minimum d'intervention humaine en poursuivant des objectifs à long terme.

AI and robotics

AI for perception, planning, and control in robotics.

AI safety

Ensuring AI systems are robust, aligned, and safe.

Anthropic Tool Use

Claude's native function/tool calling mechanism using JSON schema definitions, tool_use and tool_result message types, with support for multi-turn tool use, parallel calls, and streaming.

Assemblage de prompts

Comment l'assemblage de prompts agrège plusieurs réponses LLM pour améliorer la précision, réduire la variance et produire des sorties plus fiables.

Auto-évaluation et calibration

Comment les LLM peuvent évaluer leurs propres sorties, exprimer une incertitude calibrée et utiliser la critique pour améliorer la qualité des réponses.

Autocohérence

Comment l'autocohérence améliore le raisonnement des LLM en générant plusieurs chaînes de pensée et en sélectionnant la réponse la plus cohérente.

AutoGen

Microsoft's multi-agent conversation framework enabling LLM-powered agents to collaborate via structured message exchanges, with built-in code execution and human-in-the-loop support.

Benchmarks

Benchmarks standard pour l'IA : GLUE, SuperGLUE, MMLU et plus.

BERT

Représentations d'encodeur bidirectionnel à partir de Transformers.

Biais dans l'IA

Sources et atténuation des biais dans les systèmes de ML.

Case study — BART

Prédécesseur encodeur-décodeur de Gemini ; pré-entraînement par débruitage pour le résumé et la génération.

Case study — DeepSeek

LLM à poids ouverts de DeepSeek AI avec raisonnement et code solides ; MoE et mise à l'échelle efficace.

Case study — Qwen

Famille de LLM d'Alibaba ; support multilingue, de programmation et de contexte long.

Chain-of-thought (CoT)

Step-by-step reasoning to improve LLM outputs.

CI/CD for ML

Continuous integration and delivery adapted for machine learning — testing data, models, and code together.

Cohere

Enterprise-focused AI platform specializing in embeddings, reranking, and RAG for search and information retrieval at scale.

Compression de modèle

Réduire la taille et le calcul des modèles pour le déploiement.

Conversational memory

Memory patterns for chat agents — buffer, summary, vector, and entity memory.

CrewAI

Framework multi-agents basé sur les rôles où les agents ont des rôles, objectifs et historiques explicites, collaborant via des tâches structurées et des processus d'équipe.

Data pipelines

An overview of data pipelines in the ML context — batch vs streaming, ETL vs ELT, data quality, and schema validation.

Data Version Control (DVC)

Git for data and models — versioning datasets, pipelines, and experiments alongside source code.

Deep reinforcement learning (DRL)

RL avec des réseaux de neurones profonds pour l'approximation de fonctions.

DeepSeek

Chinese AI lab offering open-weights models with state-of-the-art reasoning and coding capabilities at significantly lower cost than proprietary alternatives.

Développement piloté par les spécifications

Construire des systèmes IA à partir de spécifications explicites.

Experiment tracking

How to systematically log, compare, and reproduce ML experiments using tracking tools.

Fine-tuning

Adapter les LLM à des tâches et domaines spécifiques.

Comment Claude Code gère la fenêtre de contexte sur de longues sessions — compression automatique, stratégies d'historique de conversation et techniques pratiques pour maintenir l'efficacité des sessions à grande échelle.

GPT

Transformer génératif pré-entraîné et modèles décodeur seul.

Hugging Face

Plateforme et bibliothèques pour modèles, jeux de données et pipelines.

IA multimodale

Modèles qui traitent et génèrent du contenu textuel, visuel, audio et vidéo.

Inférence locale

Exécuter des modèles IA sur l'appareil ou sur site plutôt que via des API cloud.

Infrastructure

Matériel et systèmes pour l'entraînement et le déploiement de l'IA : GPU, TPU, clusters.

Ingénierie automatique des prompts (APE)

Comment l'ingénierie automatique des prompts utilise les LLM pour générer, évaluer et sélectionner des instructions de prompts optimisées sans réglage manuel.

Ingénierie des prompts

Conception de prompts pour orienter le comportement des LLM et améliorer les sorties.

LangChain

Framework for LLM applications and agents.

LangGraph

Stateful agent graphs built on LangChain, where nodes are Python functions, edges define routing, and a shared TypedDict state enables cycles, conditional branching, persistence, and human-in-the-loop checkpoints.

LlamaIndex

Framework de données pour applications LLM et RAG.

Meta Llama

La famille de modèles Llama à poids ouverts de Meta — déploiement local, hébergement API tiers, fine-tuning et le débat entre modèles ouverts et fermés.

Métriques d'évaluation

Mesurer les performances des modèles sur diverses tâches.

Mistral AI

La plateforme duale de Mistral AI entre poids ouverts et API commerciale — modèles efficaces, forces multilingues et La Plateforme pour un usage entreprise.

MLflow

Open-source platform for the complete ML lifecycle, covering experiment tracking, projects, models, and the registry.

Model Context Protocol (MCP)

Un standard ouvert pour connecter les modèles d'IA à des outils, des sources de données et des services externes — permettant une utilisation d'outils portable et interopérable dans n'importe quelle application IA.

Model registry

Centralized store for versioning, staging, and governing ML model artifacts across their full lifecycle.

Modes de réflexion et effort

La réflexion étendue dans Claude Code — ce que c'est, comment les niveaux d'effort affectent la profondeur de raisonnement par rapport à la vitesse, et comment configurer le comportement de réflexion pour différents types de tâches.

Multi-agent systems

Multiple agents collaborating or competing.

ONNX Runtime

Moteur d'inférence multiplateforme haute performance pour les modèles ONNX avec support des fournisseurs d'exécution CPU, GPU et NPU.

Planner-Executor architecture

Architecture where one LLM creates a step-by-step plan and another executes each step independently.

Prompting par recul

Comment le prompting par recul améliore le raisonnement des LLM en invitant d'abord à des questions de haut niveau avant de répondre à des questions spécifiques.

PyTorch Mobile

Déployer des modèles PyTorch sur des appareils mobiles et edge en utilisant TorchScript et le runtime de nouvelle génération ExecuTorch.

RAG architecture

Components and design choices in RAG systems.

RAG examples

Example RAG pipelines and code snippets.

ReAct (Reasoning + Acting)

Entrelacement du raisonnement et de l'action dans les agents.

Reasoning patterns

How LLMs and agents structure reasoning and action.

Recherche sémantique

Recherche par sens en utilisant des embeddings et la similarité.

Réseaux de neurones convolutifs (CNN)

CNN pour les données spatiales et images.

Réseaux de neurones récurrents (RNN)

RNN et données séquentielles.

Retrieval-augmented generation (RAG)

Combining retrieval with LLM generation for accurate, grounded answers.

Retrieval-decision-design (RDD)

Spec-driven reasoning pattern combining retrieval and decision design.

Service de modèles

Stratégies et frameworks pour déployer des modèles ML comme services d'inférence évolutifs — par lots, temps réel et streaming.

Skills Claude Code

Modèles de prompts réutilisables et invocables qui étendent les capacités de Claude Code — ce que sont les skills, comment les écrire, où les stocker et comment les invoquer avec /nom-du-skill.

Sorties structurées

Comment guider les LLM pour produire des sorties dans des formats structurés comme JSON, XML, Markdown et du code, en assurant la fiabilité pour les systèmes en aval.

Sous-agents

Agents hiérarchiques et délégation.

Streaming (LLMs)

Sortie token par token pour une latence perçue plus faible et une meilleure UX.

Surveillance ML

Guide complet sur la surveillance des modèles de machine learning en production, couvrant la dérive conceptuelle, la dérive des données, la dégradation des modèles, les métriques, les stratégies d'alerte et les outils.

Techniques de désensibilisation

Comment identifier et atténuer les biais systématiques dans les sorties des LLM grâce à des stratégies de prompting, d'échantillonnage et d'ensemble.

TensorFlow Lite

Runtime léger pour l'inférence ML sur appareil sur Android, iOS, systèmes embarqués et microcontrôleurs.

Tree of thoughts (ToT)

Exploration de plusieurs branches de raisonnement.

Vector databases

Storing and searching embeddings for RAG.

Vision par ordinateur (CV)

Classification d'images, détection d'objets et segmentation.

Weights & Biases (W&B)

Cloud-native MLOps platform for experiment tracking, hyperparameter sweeps, artifact management, and collaborative reporting.