Stacks de agentes

Elige el stack de agentes que encaja con el trabajo y no el que tiene la demo mas ruidosa.

Este board separa pipelines, stacks con retrieval, agentes con memoria, orquestadores multiagente, coding agents, browser automation y local-first antes de empezar a implementar.

Familias comparadas

7

Arquetipos de stack

Rutas de alto control

6

Deterministas o muy gobernadas

Rutas con memoria

6

Importa estado o persistencia

Rutas de alta complejidad

4

Multiagente o browser intensivo

Usar memoria

Elige memoria solo cuando la continuidad de tarea compensa la carga de estado

Si el agente tiene que volver sobre trabajo, preservar contexto o mantener hilos largos, la memoria se justifica. Si no, los pipelines son mas simples.

Usar multiagente

Elige multiagente solo cuando los roles sean separables de verdad

Si no puedes definir ownership, handoffs y validacion, un agente con estado suele ser la opcion mas clara.

Usar browser stacks

Elige browser o computer-use solo cuando la interfaz sea la fuente de verdad

Si existe una API suficiente, la automatizacion de navegador deberia quedarse fuera del camino critico.

Board de decision

Compara familias de stack segun realidad operativa

Snapshot verificado con docs
Familia de stack Usalo cuando Control y memoria Presupuesto y complejidad Cautela
Simple pipelines

Temporal, n8n, Queues + workers

Usalo cuando el problema real es coordinar tareas fiables, no simular autonomia

Flujos repetibles, aprobaciones, ETL operativa y automatizacion con pasos claros

Alta y determinista No requiere memoria conversacional
Baja-media

Predecible

Si metes demasiada autonomia en un pipeline fijo, complicas soporte sin ganar mucho

Fuente oficial: Temporal docs
Retrieval + tools stacks

LlamaIndex, PydanticAI, LangGraph

Usalo cuando necesites herramientas y retrieval antes que un enjambre de agentes

Copilots con grounding, asistentes internos y workflows donde importa usar datos propios

Alta si defines retrieval, tools y guardrails Memoria ligera o contextual
Media

Media y controlable

La calidad cae rapido si retrieval, ranking y tool policy no estan bien definidos

Fuente oficial: LlamaIndex docs
Stateful single agents

LangGraph, PydanticAI, Custom memory store

Usalo cuando un solo agente con memoria basta y un multiagente seria sobreingenieria

Agentes que vuelven sobre el trabajo, recuerdan contexto y necesitan continuidad de tarea

Alta con buena capa de estado Memoria persistente o de sesion
Media-alta

Variable

La memoria sin politica clara genera acumulacion de contexto y decisiones inconsistentes

Fuente oficial: LangGraph docs
Multi-agent orchestrators

CrewAI, AutoGen, LangGraph supervisor

Usalo cuando una sola loop no basta y puedes definir ownership, handoffs y validacion

Problemas complejos con roles distintos, paralelismo real y necesidad de coordinacion

Media-alta, depende de ownership y mensajes Memoria compartida o por agente
Alta

Alta si no hay routing duro

Si no hay ownership de archivos, trazabilidad y limites de autonomia, el coste explota

Fuente oficial: CrewAI docs
Coding agents

Codex CLI, Claude Code, Repo tool runners

Usalo cuando el centro de gravedad es el repositorio y no una UI conversacional

Refactors acotados, test generation, code review y ejecucion guiada por herramientas

Alta si el repo tiene checks y ownership Contexto de repo y tarea
Media

Media-alta segun modelo

Sin build, tests y diffs pequenos, el throughput se convierte en deuda tecnica

Fuente oficial: PydanticAI docs
Browser and computer-use stacks

Playwright, Browser tool runners, Computer-use loops

Usalo cuando la unica verdad esta en la interfaz y no hay API suficiente

Web ops, QA, formularios, scraping guiado y tareas donde la UI es parte del trabajo

Media si no hay asserts y snapshots Memoria corta y estado de navegador
Alta

Media-alta por fragilidad operativa

Es la familia mas sensible a cambios de UI, auth y flujos no deterministas

Fuente oficial: Playwright docs
Local-first agent stacks

Ollama, Local tool runners, Private vector stores

Usalo cuando residencia de datos, coste recurrente o autonomia local pesan mas que el ultimo benchmark

Privacidad, soberania, edge y equipos que aceptan sacrificar algo de frontier a cambio de control

Muy alta Memoria y datos bajo control local
Media-alta

Capex primero, opex bajo

Hardware, observabilidad y mantenimiento de modelos pasan a ser parte del producto

Fuente oficial: Ollama docs

Simple pipelines

Temporal, n8n, Queues + workers

Usalo cuando: Usalo cuando el problema real es coordinar tareas fiables, no simular autonomia

Mejor para: Flujos repetibles, aprobaciones, ETL operativa y automatizacion con pasos claros

Control: Alta y determinista

Memoria: No requiere memoria conversacional

Complejidad: Baja-media

Presupuesto: Predecible

Cautela: Si metes demasiada autonomia en un pipeline fijo, complicas soporte sin ganar mucho

Fuente oficial

Retrieval + tools stacks

LlamaIndex, PydanticAI, LangGraph

Usalo cuando: Usalo cuando necesites herramientas y retrieval antes que un enjambre de agentes

Mejor para: Copilots con grounding, asistentes internos y workflows donde importa usar datos propios

Control: Alta si defines retrieval, tools y guardrails

Memoria: Memoria ligera o contextual

Complejidad: Media

Presupuesto: Media y controlable

Cautela: La calidad cae rapido si retrieval, ranking y tool policy no estan bien definidos

Fuente oficial

Stateful single agents

LangGraph, PydanticAI, Custom memory store

Usalo cuando: Usalo cuando un solo agente con memoria basta y un multiagente seria sobreingenieria

Mejor para: Agentes que vuelven sobre el trabajo, recuerdan contexto y necesitan continuidad de tarea

Control: Alta con buena capa de estado

Memoria: Memoria persistente o de sesion

Complejidad: Media-alta

Presupuesto: Variable

Cautela: La memoria sin politica clara genera acumulacion de contexto y decisiones inconsistentes

Fuente oficial

Multi-agent orchestrators

CrewAI, AutoGen, LangGraph supervisor

Usalo cuando: Usalo cuando una sola loop no basta y puedes definir ownership, handoffs y validacion

Mejor para: Problemas complejos con roles distintos, paralelismo real y necesidad de coordinacion

Control: Media-alta, depende de ownership y mensajes

Memoria: Memoria compartida o por agente

Complejidad: Alta

Presupuesto: Alta si no hay routing duro

Cautela: Si no hay ownership de archivos, trazabilidad y limites de autonomia, el coste explota

Fuente oficial

Coding agents

Codex CLI, Claude Code, Repo tool runners

Usalo cuando: Usalo cuando el centro de gravedad es el repositorio y no una UI conversacional

Mejor para: Refactors acotados, test generation, code review y ejecucion guiada por herramientas

Control: Alta si el repo tiene checks y ownership

Memoria: Contexto de repo y tarea

Complejidad: Media

Presupuesto: Media-alta segun modelo

Cautela: Sin build, tests y diffs pequenos, el throughput se convierte en deuda tecnica

Fuente oficial

Browser and computer-use stacks

Playwright, Browser tool runners, Computer-use loops

Usalo cuando: Usalo cuando la unica verdad esta en la interfaz y no hay API suficiente

Mejor para: Web ops, QA, formularios, scraping guiado y tareas donde la UI es parte del trabajo

Control: Media si no hay asserts y snapshots

Memoria: Memoria corta y estado de navegador

Complejidad: Alta

Presupuesto: Media-alta por fragilidad operativa

Cautela: Es la familia mas sensible a cambios de UI, auth y flujos no deterministas

Fuente oficial

Local-first agent stacks

Ollama, Local tool runners, Private vector stores

Usalo cuando: Usalo cuando residencia de datos, coste recurrente o autonomia local pesan mas que el ultimo benchmark

Mejor para: Privacidad, soberania, edge y equipos que aceptan sacrificar algo de frontier a cambio de control

Control: Muy alta

Memoria: Memoria y datos bajo control local

Complejidad: Media-alta

Presupuesto: Capex primero, opex bajo

Cautela: Hardware, observabilidad y mantenimiento de modelos pasan a ser parte del producto

Fuente oficial

Ruta

Ruta LLM

Vuelve a la capa de routing si el bloqueo sigue siendo vendor, detalle tecnico de modelo o alcance de workflow.

Ruta

Model fit radar

Usa picks por escenario cuando la familia de stack ya esta clara pero no la lane de modelo por defecto.

Ruta

Inference guide

Salta a hardware cuando private serving, VRAM o la forma de la workstation ya limitan el stack.

Ruta

Workflow recipes

Usa recetas operativas cuando la familia ya esta elegida y la siguiente pregunta es como ejecutarla.

Ruta

Directorio de agentes

Vuelve al mapa de frameworks cuando la familia ya esta decidida y necesitas contexto de tooling.