AutoGen

Definición

AutoGen es un framework de código abierto desarrollado por Microsoft Research para construir sistemas de IA conversacional multi-agente. Su idea central es simple: los agentes se comunican intercambiando mensajes en una conversación estructurada, y el framework maneja la lógica de enrutamiento, turno y terminación. A diferencia de frameworks basados en roles como CrewAI que definen agentes como personas con tareas, los agentes AutoGen se definen principalmente por su comportamiento conversacional — cómo responden a los mensajes, si pueden ejecutar código y cuándo ceden el control a otro agente o a un humano.

El primitivo más importante del framework es el ConversableAgent — una clase base que puede desempeñar cualquier rol dependiendo de su configuración. Dos especializaciones cubren los patrones más comunes: AssistantAgent (respaldado por un LLM, responde con planes y código) y UserProxyAgent (opcionalmente respaldado por un humano o un ejecutor de código, ejecuta código localmente y devuelve los resultados). Este patrón de dos agentes es poderoso de entrada: se obtiene un bucle de escritura de código donde el asistente propone soluciones y el proxy las ejecuta e informa resultados, sin andamiaje adicional.

AutoGen también admite chats grupales, donde tres o más agentes se turnan para contribuir a una conversación compartida gestionada por un GroupChatManager. Human-in-the-loop es una característica de primera clase: el UserProxyAgent puede pausar y pedir información humana en cualquier momento, lo que lo hace adecuado para flujos de trabajo de investigación y experimentación.

Cómo funciona

ConversableAgent: el bloque de construcción universal

ConversableAgent es la clase base para todos los agentes AutoGen. Contiene un mensaje de sistema, una configuración LLM opcional, una lista de funciones registradas (herramientas) y un conjunto de reglas para cuándo terminar una conversación (is_termination_msg). Cada agente tiene un método generate_reply que decide qué mensaje enviar a continuación dado el historial de conversación. Los agentes pueden ser agentes proxy humanos (pausan y piden entrada), agentes LLM (generan respuestas con un LLM) o agentes ejecutores (ejecutan código sin llamadas LLM). Esta flexibilidad significa que una sola clase base cubre todo el espectro desde agentes completamente automatizados hasta completamente manuales.

AssistantAgent y UserProxyAgent

AssistantAgent es un ConversableAgent preconfigurado como asistente de IA útil: tiene un mensaje de sistema predeterminado que lo anima a proponer bloques de código Python para tareas que requieren cómputo. UserProxyAgent está preconfigurado para ejecutar bloques de código en un contenedor Docker local o subproceso, informar resultados y opcionalmente pedir entrada humana cuando no puede proceder automáticamente. Juntos forman el bucle canónico de dos agentes AutoGen: el asistente sugiere código, el proxy lo ejecuta, la salida vuelve al asistente, y el bucle continúa hasta que la tarea está completa o se activa una condición de terminación. Este patrón es particularmente poderoso para análisis de datos, scripts de automatización y experimentación de ML.

Chats grupales y GroupChatManager

Para flujos de trabajo con tres o más agentes, AutoGen proporciona GroupChat y GroupChatManager. GroupChat contiene la lista de agentes participantes y el historial de mensajes compartido. GroupChatManager es en sí mismo un ConversableAgent que actúa como moderador: después de cada mensaje selecciona al siguiente orador (ya sea por una regla de round-robin, una función selectora personalizada o una estrategia de selección basada en LLM). Los chats grupales permiten patrones de panel de expertos donde un investigador, un programador y un revisor se turnan, o pipelines de múltiples pasos donde cada agente maneja una fase.

Ejecución de código y human-in-the-loop

La capa de ejecución de código de AutoGen es configurable: los agentes pueden ejecutar código localmente (subproceso), en un contenedor Docker (aislado) o a través de un ejecutor personalizado. El UserProxyAgent detecta bloques de código en los mensajes del asistente y los ejecuta automáticamente cuando human_input_mode="NEVER". Establecer human_input_mode="ALWAYS" o "TERMINATE" pone la ejecución detrás de la aprobación humana, permitiendo patrones seguros de human-in-the-loop para flujos de trabajo de producción o sensibles.

Cuándo usar / Cuándo NO usar

Usar cuando	Evitar cuando
Necesitas agentes que escriban y ejecuten código como parte del flujo de trabajo	La ejecución de código no es necesaria y el overhead conversacional no es deseado
Quieres human-in-the-loop en puntos de control configurables	Pipelines completamente automatizados donde la intervención humana es indeseable
Tu flujo de trabajo implica investigación, experimentación o refinamiento iterativo	Necesitas una API declarativa y opinada — AutoGen requiere más configuración manual
Quieres un panel de expertos multi-agente o patrón de debate (chat grupal)	Necesitas pipelines deterministas y comprobables — los flujos conversacionales no deterministas son más difíciles de probar unitariamente
Estás prototipando asistentes de codificación agénticos o automatización de ciencia de datos	La latencia de producción es crítica — los bucles de conversación de múltiples turnos añaden overhead significativo

Comparaciones

Criterio	AutoGen	CrewAI	LangGraph
Metáfora central	Agentes como participantes conversacionales	Agentes como miembros de la tripulación que juegan roles	Comportamiento del agente como grafo con estado
Gestión de estado	Implícita: historial de mensajes compartido en GroupChat	Implícita: contexto de tarea y memoria de la tripulación	Explícita: estado TypedDict compartido entre todos los nodos
Ejecución de código	De primera clase: UserProxyAgent ejecuta bloques de código automáticamente	Solo a través de herramientas externas	A través de nodos de herramientas en el grafo
Human-in-the-loop	De primera clase: `human_input_mode` en cada agente	Limitado: solo intervención manual	De primera clase: `interrupt_before` / `interrupt_after` en nodos del grafo
Curva de aprendizaje	Media: intuitivo para desarrolladores Python, pero el enrutamiento de chat grupal puede ser complejo	Baja: la API declarativa es fácil de aprender	Alta: requiere pensamiento basado en grafos

Ejemplos de código

import os
import autogen

# --- LLM configuration ---
# AutoGen uses a list of configs for load balancing / fallback.
# Set your OPENAI_API_KEY or use an Anthropic-compatible config.
llm_config = {
    "config_list": [
        {
            "model": "gpt-4o",
            "api_key": os.environ.get("OPENAI_API_KEY"),
        }
    ],
    "temperature": 0.1,
    "timeout": 120,
}

# --- Two-agent pattern: AssistantAgent + UserProxyAgent ---
# The assistant writes code; the proxy executes it and reports results.

assistant = autogen.AssistantAgent(
    name="data_analyst",
    system_message=(
        "You are a data analysis expert. When given a task, write Python code to solve it. "
        "Always verify your results by printing them. "
        "Reply TERMINATE when the task is fully complete."
    ),
    llm_config=llm_config,
)

user_proxy = autogen.UserProxyAgent(
    name="user_proxy",
    human_input_mode="NEVER",       # fully automated; change to "ALWAYS" for human review
    max_consecutive_auto_reply=10,  # safety limit on auto-replies
    is_termination_msg=lambda msg: "TERMINATE" in msg.get("content", ""),
    code_execution_config={
        "work_dir": "/tmp/autogen_workspace",
        "use_docker": False,         # set True to execute in an isolated Docker container
    },
)

# Kick off the two-agent conversation
user_proxy.initiate_chat(
    assistant,
    message=(
        "Analyze the following data and compute the mean, median, and standard deviation. "
        "Data: [12, 45, 23, 67, 34, 89, 11, 56, 78, 42]"
    ),
)


# --- Group chat pattern: researcher, coder, reviewer ---
# Three specialized agents collaborate on a more complex task.

researcher = autogen.AssistantAgent(
    name="researcher",
    system_message=(
        "You are a research specialist. Find information and summarize findings. "
        "Do not write code — delegate code tasks to the coder."
    ),
    llm_config=llm_config,
)

coder = autogen.AssistantAgent(
    name="coder",
    system_message=(
        "You are a Python expert. Write clean, well-commented code when asked. "
        "Always include error handling and print results clearly."
    ),
    llm_config=llm_config,
)

reviewer = autogen.AssistantAgent(
    name="reviewer",
    system_message=(
        "You are a critical reviewer. After the researcher and coder have finished, "
        "review the outputs for accuracy and completeness. "
        "Reply TERMINATE when you are satisfied with the result."
    ),
    llm_config=llm_config,
)

group_proxy = autogen.UserProxyAgent(
    name="group_proxy",
    human_input_mode="NEVER",
    max_consecutive_auto_reply=15,
    is_termination_msg=lambda msg: "TERMINATE" in msg.get("content", ""),
    code_execution_config={"work_dir": "/tmp/autogen_group", "use_docker": False},
)

# GroupChat manages turn order and shared message history
group_chat = autogen.GroupChat(
    agents=[group_proxy, researcher, coder, reviewer],
    messages=[],
    max_round=12,
    speaker_selection_method="auto",  # LLM-based speaker selection
)

manager = autogen.GroupChatManager(
    groupchat=group_chat,
    llm_config=llm_config,
)

group_proxy.initiate_chat(
    manager,
    message=(
        "Research the top 3 Python libraries for data visualization in 2025. "
        "Then write a code example using the most popular one to plot a bar chart."
    ),
)

Recursos prácticos

Documentación oficial de AutoGen — Referencia completa del framework que cubre agentes, chat grupal, ejecución de código y uso de herramientas.
Repositorio GitHub de AutoGen — Código fuente, rastreador de problemas y un rico conjunto de notebooks de ejemplo.
Paper de AutoGen: "AutoGen: Enabling Next-Gen LLM Applications via Multi-Agent Conversation" (Wu et al., 2023) — Paper de investigación original que motiva el diseño multi-agente basado en conversación.
AutoGen Studio — UI sin código para construir y probar flujos de trabajo AutoGen, útil para prototipos.

Definición​

Cómo funciona​

ConversableAgent: el bloque de construcción universal​

AssistantAgent y UserProxyAgent​

Chats grupales y GroupChatManager​

Ejecución de código y human-in-the-loop​

Cuándo usar / Cuándo NO usar​

Comparaciones​

Ejemplos de código​

Recursos prácticos​

Ver también​