Stacks de agentes

Elige el stack de agentes que encaja con el trabajo y no el que tiene la demo mas ruidosa.

Este board separa pipelines, stacks con retrieval, agentes con memoria, orquestadores multiagente, coding agents, browser automation y local-first antes de empezar a implementar.

Abrir recetas Abrir guia de hardware

Familias comparadas

Arquetipos de stack

Rutas de alto control

Deterministas o muy gobernadas

Rutas con memoria

Importa estado o persistencia

Rutas de alta complejidad

Multiagente o browser intensivo

Usar memoria

Elige memoria solo cuando la continuidad de tarea compensa la carga de estado

Si el agente tiene que volver sobre trabajo, preservar contexto o mantener hilos largos, la memoria se justifica. Si no, los pipelines son mas simples.

Usar multiagente

Elige multiagente solo cuando los roles sean separables de verdad

Si no puedes definir ownership, handoffs y validacion, un agente con estado suele ser la opcion mas clara.

Usar browser stacks

Elige browser o computer-use solo cuando la interfaz sea la fuente de verdad

Si existe una API suficiente, la automatizacion de navegador deberia quedarse fuera del camino critico.

Board de decision

Compara familias de stack segun realidad operativa

Snapshot verificado con docs

Familia de stack	Usalo cuando	Control y memoria	Presupuesto y complejidad	Cautela
Simple pipelines Temporal, n8n, Queues + workers	Usalo cuando el problema real es coordinar tareas fiables, no simular autonomia Flujos repetibles, aprobaciones, ETL operativa y automatizacion con pasos claros	Alta y determinista No requiere memoria conversacional	Baja-media Predecible	Si metes demasiada autonomia en un pipeline fijo, complicas soporte sin ganar mucho Fuente oficial: Temporal docs
Retrieval + tools stacks LlamaIndex, PydanticAI, LangGraph	Usalo cuando necesites herramientas y retrieval antes que un enjambre de agentes Copilots con grounding, asistentes internos y workflows donde importa usar datos propios	Alta si defines retrieval, tools y guardrails Memoria ligera o contextual	Media Media y controlable	La calidad cae rapido si retrieval, ranking y tool policy no estan bien definidos Fuente oficial: LlamaIndex docs
Stateful single agents LangGraph, PydanticAI, Custom memory store	Usalo cuando un solo agente con memoria basta y un multiagente seria sobreingenieria Agentes que vuelven sobre el trabajo, recuerdan contexto y necesitan continuidad de tarea	Alta con buena capa de estado Memoria persistente o de sesion	Media-alta Variable	La memoria sin politica clara genera acumulacion de contexto y decisiones inconsistentes Fuente oficial: LangGraph docs
Multi-agent orchestrators CrewAI, AutoGen, LangGraph supervisor	Usalo cuando una sola loop no basta y puedes definir ownership, handoffs y validacion Problemas complejos con roles distintos, paralelismo real y necesidad de coordinacion	Media-alta, depende de ownership y mensajes Memoria compartida o por agente	Alta Alta si no hay routing duro	Si no hay ownership de archivos, trazabilidad y limites de autonomia, el coste explota Fuente oficial: CrewAI docs
Coding agents Codex CLI, Claude Code, Repo tool runners	Usalo cuando el centro de gravedad es el repositorio y no una UI conversacional Refactors acotados, test generation, code review y ejecucion guiada por herramientas	Alta si el repo tiene checks y ownership Contexto de repo y tarea	Media Media-alta segun modelo	Sin build, tests y diffs pequenos, el throughput se convierte en deuda tecnica Fuente oficial: PydanticAI docs
Browser and computer-use stacks Playwright, Browser tool runners, Computer-use loops	Usalo cuando la unica verdad esta en la interfaz y no hay API suficiente Web ops, QA, formularios, scraping guiado y tareas donde la UI es parte del trabajo	Media si no hay asserts y snapshots Memoria corta y estado de navegador	Alta Media-alta por fragilidad operativa	Es la familia mas sensible a cambios de UI, auth y flujos no deterministas Fuente oficial: Playwright docs
Local-first agent stacks Ollama, Local tool runners, Private vector stores	Usalo cuando residencia de datos, coste recurrente o autonomia local pesan mas que el ultimo benchmark Privacidad, soberania, edge y equipos que aceptan sacrificar algo de frontier a cambio de control	Muy alta Memoria y datos bajo control local	Media-alta Capex primero, opex bajo	Hardware, observabilidad y mantenimiento de modelos pasan a ser parte del producto Fuente oficial: Ollama docs

Simple pipelines

Temporal, n8n, Queues + workers

Usalo cuando: Usalo cuando el problema real es coordinar tareas fiables, no simular autonomia

Mejor para: Flujos repetibles, aprobaciones, ETL operativa y automatizacion con pasos claros

Control: Alta y determinista

Memoria: No requiere memoria conversacional

Complejidad: Baja-media

Presupuesto: Predecible

Cautela: Si metes demasiada autonomia en un pipeline fijo, complicas soporte sin ganar mucho

Fuente oficial

Retrieval + tools stacks

LlamaIndex, PydanticAI, LangGraph

Usalo cuando: Usalo cuando necesites herramientas y retrieval antes que un enjambre de agentes

Mejor para: Copilots con grounding, asistentes internos y workflows donde importa usar datos propios

Control: Alta si defines retrieval, tools y guardrails

Memoria: Memoria ligera o contextual

Complejidad: Media

Presupuesto: Media y controlable

Cautela: La calidad cae rapido si retrieval, ranking y tool policy no estan bien definidos

Fuente oficial

Stateful single agents

LangGraph, PydanticAI, Custom memory store

Usalo cuando: Usalo cuando un solo agente con memoria basta y un multiagente seria sobreingenieria

Mejor para: Agentes que vuelven sobre el trabajo, recuerdan contexto y necesitan continuidad de tarea

Control: Alta con buena capa de estado

Memoria: Memoria persistente o de sesion

Complejidad: Media-alta

Presupuesto: Variable

Cautela: La memoria sin politica clara genera acumulacion de contexto y decisiones inconsistentes

Fuente oficial

Multi-agent orchestrators

CrewAI, AutoGen, LangGraph supervisor

Usalo cuando: Usalo cuando una sola loop no basta y puedes definir ownership, handoffs y validacion

Mejor para: Problemas complejos con roles distintos, paralelismo real y necesidad de coordinacion

Control: Media-alta, depende de ownership y mensajes

Memoria: Memoria compartida o por agente

Complejidad: Alta

Presupuesto: Alta si no hay routing duro

Cautela: Si no hay ownership de archivos, trazabilidad y limites de autonomia, el coste explota

Fuente oficial

Coding agents

Codex CLI, Claude Code, Repo tool runners

Usalo cuando: Usalo cuando el centro de gravedad es el repositorio y no una UI conversacional

Mejor para: Refactors acotados, test generation, code review y ejecucion guiada por herramientas

Control: Alta si el repo tiene checks y ownership

Memoria: Contexto de repo y tarea

Complejidad: Media

Presupuesto: Media-alta segun modelo

Cautela: Sin build, tests y diffs pequenos, el throughput se convierte en deuda tecnica

Fuente oficial

Browser and computer-use stacks

Playwright, Browser tool runners, Computer-use loops

Usalo cuando: Usalo cuando la unica verdad esta en la interfaz y no hay API suficiente

Mejor para: Web ops, QA, formularios, scraping guiado y tareas donde la UI es parte del trabajo

Control: Media si no hay asserts y snapshots

Memoria: Memoria corta y estado de navegador

Complejidad: Alta

Presupuesto: Media-alta por fragilidad operativa

Cautela: Es la familia mas sensible a cambios de UI, auth y flujos no deterministas

Fuente oficial

Local-first agent stacks

Ollama, Local tool runners, Private vector stores

Usalo cuando: Usalo cuando residencia de datos, coste recurrente o autonomia local pesan mas que el ultimo benchmark

Mejor para: Privacidad, soberania, edge y equipos que aceptan sacrificar algo de frontier a cambio de control

Control: Muy alta

Memoria: Memoria y datos bajo control local

Complejidad: Media-alta

Presupuesto: Capex primero, opex bajo

Cautela: Hardware, observabilidad y mantenimiento de modelos pasan a ser parte del producto

Fuente oficial

Ruta

Ruta LLM

Vuelve a la capa de routing si el bloqueo sigue siendo vendor, detalle tecnico de modelo o alcance de workflow.

Abrir ruta LLM

Ruta

Model fit radar

Usa picks por escenario cuando la familia de stack ya esta clara pero no la lane de modelo por defecto.

Abrir radar

Ruta

Inference guide

Salta a hardware cuando private serving, VRAM o la forma de la workstation ya limitan el stack.

Abrir hardware

Ruta

Workflow recipes

Usa recetas operativas cuando la familia ya esta elegida y la siguiente pregunta es como ejecutarla.

Abrir recetas

Ruta

Directorio de agentes

Vuelve al mapa de frameworks cuando la familia ya esta decidida y necesitas contexto de tooling.

Abrir directorio