AutoGen

Définition

AutoGen est un framework open-source développé par Microsoft Research pour construire des systèmes d'IA conversationnelle multi-agents. Son idée centrale est simple : les agents communiquent en échangeant des messages dans une conversation structurée, et le framework gère la logique de routage, de passage de tour et de terminaison. Contrairement aux frameworks basés sur les rôles comme CrewAI qui définissent les agents comme des personas avec des tâches, les agents AutoGen sont définis principalement par leur comportement conversationnel — comment ils répondent aux messages, s'ils peuvent exécuter du code et quand ils cèdent le contrôle à un autre agent ou à un humain.

La primitive la plus importante du framework est le ConversableAgent — une classe de base qui peut jouer n'importe quel rôle selon sa configuration. Deux spécialisations couvrent les patterns les plus courants : AssistantAgent (soutenu par un LLM, répond avec des plans et du code) et UserProxyAgent (optionnellement soutenu par un humain ou un exécuteur de code, exécute du code localement et renvoie les résultats). Ce pattern à deux agents est puissant dès le départ : vous obtenez une boucle d'écriture de code où l'assistant propose des solutions et le proxy les exécute et rapporte les résultats, sans échafaudage supplémentaire.

AutoGen prend également en charge les chats de groupe, où trois agents ou plus prennent tour à tour part à une conversation partagée gérée par un GroupChatManager. Human-in-the-loop est une fonctionnalité de première classe : le UserProxyAgent peut faire une pause et demander une saisie humaine à tout moment, ce qui le rend bien adapté aux flux de travail de recherche et d'expérimentation.

Fonctionnement

ConversableAgent : le bloc de construction universel

ConversableAgent est la classe de base pour tous les agents AutoGen. Il contient un message système, une configuration LLM optionnelle, une liste de fonctions enregistrées (outils) et un ensemble de règles pour savoir quand terminer une conversation (is_termination_msg). Chaque agent a une méthode generate_reply qui décide quel message envoyer ensuite étant donné l'historique de la conversation. Les agents peuvent être configurés comme agents proxy humains (ils font une pause et demandent une entrée), agents LLM (ils génèrent des réponses avec un LLM) ou agents exécuteurs (ils exécutent du code sans appels LLM). Cette flexibilité signifie qu'une seule classe de base couvre tout le spectre des agents entièrement automatisés aux agents entièrement manuels.

AssistantAgent et UserProxyAgent

AssistantAgent est un ConversableAgent préconfiguré comme assistant IA utile : il a un message système par défaut qui l'encourage à proposer des blocs de code Python pour les tâches nécessitant un calcul. UserProxyAgent est préconfiguré pour exécuter des blocs de code dans un conteneur Docker local ou un sous-processus, rapporter les résultats et éventuellement demander une entrée humaine lorsqu'il ne peut pas procéder automatiquement. Ensemble, ils forment la boucle canonique à deux agents AutoGen : l'assistant suggère du code, le proxy l'exécute, la sortie revient à l'assistant, et la boucle continue jusqu'à ce que la tâche soit terminée ou qu'une condition de terminaison se déclenche. Ce pattern est particulièrement puissant pour l'analyse de données, les scripts d'automatisation et l'expérimentation ML.

Chats de groupe et GroupChatManager

Pour les flux de travail avec trois agents ou plus, AutoGen fournit GroupChat et GroupChatManager. GroupChat contient la liste des agents participants et l'historique des messages partagé. GroupChatManager est lui-même un ConversableAgent qui agit comme modérateur : après chaque message, il sélectionne le prochain intervenant (soit par une règle de round-robin, une fonction de sélection personnalisée ou une stratégie de sélection basée sur LLM). Les chats de groupe permettent des patterns de panel d'experts où un chercheur, un codeur et un réviseur prennent tour à tour la parole, ou des pipelines à plusieurs étapes où chaque agent gère une phase.

Exécution de code et human-in-the-loop

La couche d'exécution de code d'AutoGen est configurable : les agents peuvent exécuter du code localement (sous-processus), dans un conteneur Docker (isolé) ou via un exécuteur personnalisé. Le UserProxyAgent détecte les blocs de code dans les messages de l'assistant et les exécute automatiquement lorsque human_input_mode="NEVER". Définir human_input_mode="ALWAYS" ou "TERMINATE" place l'exécution derrière l'approbation humaine, permettant des patterns human-in-the-loop sécurisés pour les flux de travail de production ou sensibles.

Quand utiliser / Quand NE PAS utiliser

Utiliser quand	Éviter quand
Vous avez besoin d'agents qui écrivent et exécutent du code dans le cadre du flux de travail	L'exécution de code n'est pas nécessaire et la surcharge conversationnelle est indésirable
Vous souhaitez un human-in-the-loop à des points de contrôle configurables	Pipelines entièrement automatisés où l'intervention humaine est indésirable
Votre flux de travail implique de la recherche, de l'expérimentation ou un raffinement itératif	Vous avez besoin d'une API déclarative et opinée — AutoGen nécessite plus de configuration manuelle
Vous voulez un panel d'experts multi-agents ou un pattern de débat (chat de groupe)	Vous avez besoin de pipelines déterministes et testables — les flux conversationnels non déterministes sont plus difficiles à tester unitairement
Vous prototypez des assistants de codage agentiques ou de l'automatisation de science des données	La latence de production est critique — les boucles de conversation multi-tours ajoutent une surcharge significative

Comparaisons

Critère	AutoGen	CrewAI	LangGraph
Métaphore centrale	Agents comme participants conversationnels	Agents comme membres d'équipage jouant des rôles	Comportement de l'agent comme graphe avec état
Gestion de l'état	Implicite : historique de messages partagé dans GroupChat	Implicite : contexte de tâche et mémoire de l'équipage	Explicite : état TypedDict partagé entre tous les nœuds
Exécution de code	Première classe : UserProxyAgent exécute automatiquement les blocs de code	Via des outils externes uniquement	Via des nœuds d'outils dans le graphe
Human-in-the-loop	Première classe : `human_input_mode` sur chaque agent	Limité : intervention manuelle uniquement	Première classe : `interrupt_before` / `interrupt_after` sur les nœuds du graphe
Courbe d'apprentissage	Moyenne : intuitif pour les développeurs Python, mais le routage du chat de groupe peut être complexe	Faible : l'API déclarative est facile à apprendre	Élevée : nécessite une pensée basée sur les graphes

Exemples de code

import os
import autogen

# --- LLM configuration ---
# AutoGen uses a list of configs for load balancing / fallback.
# Set your OPENAI_API_KEY or use an Anthropic-compatible config.
llm_config = {
    "config_list": [
        {
            "model": "gpt-4o",
            "api_key": os.environ.get("OPENAI_API_KEY"),
        }
    ],
    "temperature": 0.1,
    "timeout": 120,
}

# --- Two-agent pattern: AssistantAgent + UserProxyAgent ---
# The assistant writes code; the proxy executes it and reports results.

assistant = autogen.AssistantAgent(
    name="data_analyst",
    system_message=(
        "You are a data analysis expert. When given a task, write Python code to solve it. "
        "Always verify your results by printing them. "
        "Reply TERMINATE when the task is fully complete."
    ),
    llm_config=llm_config,
)

user_proxy = autogen.UserProxyAgent(
    name="user_proxy",
    human_input_mode="NEVER",       # fully automated; change to "ALWAYS" for human review
    max_consecutive_auto_reply=10,  # safety limit on auto-replies
    is_termination_msg=lambda msg: "TERMINATE" in msg.get("content", ""),
    code_execution_config={
        "work_dir": "/tmp/autogen_workspace",
        "use_docker": False,         # set True to execute in an isolated Docker container
    },
)

# Kick off the two-agent conversation
user_proxy.initiate_chat(
    assistant,
    message=(
        "Analyze the following data and compute the mean, median, and standard deviation. "
        "Data: [12, 45, 23, 67, 34, 89, 11, 56, 78, 42]"
    ),
)


# --- Group chat pattern: researcher, coder, reviewer ---
# Three specialized agents collaborate on a more complex task.

researcher = autogen.AssistantAgent(
    name="researcher",
    system_message=(
        "You are a research specialist. Find information and summarize findings. "
        "Do not write code — delegate code tasks to the coder."
    ),
    llm_config=llm_config,
)

coder = autogen.AssistantAgent(
    name="coder",
    system_message=(
        "You are a Python expert. Write clean, well-commented code when asked. "
        "Always include error handling and print results clearly."
    ),
    llm_config=llm_config,
)

reviewer = autogen.AssistantAgent(
    name="reviewer",
    system_message=(
        "You are a critical reviewer. After the researcher and coder have finished, "
        "review the outputs for accuracy and completeness. "
        "Reply TERMINATE when you are satisfied with the result."
    ),
    llm_config=llm_config,
)

group_proxy = autogen.UserProxyAgent(
    name="group_proxy",
    human_input_mode="NEVER",
    max_consecutive_auto_reply=15,
    is_termination_msg=lambda msg: "TERMINATE" in msg.get("content", ""),
    code_execution_config={"work_dir": "/tmp/autogen_group", "use_docker": False},
)

# GroupChat manages turn order and shared message history
group_chat = autogen.GroupChat(
    agents=[group_proxy, researcher, coder, reviewer],
    messages=[],
    max_round=12,
    speaker_selection_method="auto",  # LLM-based speaker selection
)

manager = autogen.GroupChatManager(
    groupchat=group_chat,
    llm_config=llm_config,
)

group_proxy.initiate_chat(
    manager,
    message=(
        "Research the top 3 Python libraries for data visualization in 2025. "
        "Then write a code example using the most popular one to plot a bar chart."
    ),
)

Ressources pratiques

Documentation officielle d'AutoGen — Référence complète du framework couvrant les agents, le chat de groupe, l'exécution de code et l'utilisation d'outils.
Dépôt GitHub d'AutoGen — Code source, gestionnaire de problèmes et un riche ensemble de notebooks d'exemples.
Paper AutoGen : "AutoGen: Enabling Next-Gen LLM Applications via Multi-Agent Conversation" (Wu et al., 2023) — Paper de recherche original motivant la conception multi-agents basée sur la conversation.
AutoGen Studio — Interface sans code pour construire et tester des flux de travail AutoGen, utile pour le prototypage.

Définition​

Fonctionnement​

ConversableAgent : le bloc de construction universel​

AssistantAgent et UserProxyAgent​

Chats de groupe et GroupChatManager​

Exécution de code et human-in-the-loop​

Quand utiliser / Quand NE PAS utiliser​

Comparaisons​

Exemples de code​

Ressources pratiques​

Voir aussi​